向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
直播间兴起“代打电话” 主播称能赚钱但有点“擦边”******
直播间兴起“代打电话”:表白、整蛊、讨债……
主播称能赚钱但有点“擦边”
最近,“代打电话”在直播间兴起。网友只要打赏礼物,主播就可以提供“代打电话”服务。主播根据网友私信提供的电话号码、名字、想说的话,打出一通通电话。客户要求五花八门,有表白、送祝福的;有整蛊、讨债的;还有联系前任、测试男女朋友的。每个直播间,围观主播打电话的从一二十到几千不等。有人入行4个月挣了4万元,有的主播一天直播8小时,日入千元。律师表示,提供他人电话涉嫌侵犯他人隐私权;对于主播代打电话问题,因涉及内容不同,所产生的法律后果也不同;网友进行打赏委托,若主播实施违法行为,网友与主播应当承担相应的法律责任;平台也应肩负起应有的监管责任。
扬子晚报/紫牛新闻记者 万惠娟
记者蹲守“代打电话”直播间 有人表白,有人测试男友
2月1日晚10点,扬子晚报紫牛新闻记者进入一个代打电话直播间,主播是位年轻女生,长相甜美,声音温柔,微笑说着:“大家给我点点赞,想说的话私信发我,还有要打电话的吗?”直播间显示观看人数8586人, 点赞5.3万次。
评论区有人问:“打电话要怎么下单,送啥礼物?”
主播:“礼花筒排队,热气球插队,刷完把号码、姓名、想说的话私信发给我就可以。”
留言者:“男友一直不接我电话,你打一下,看他接不接别人电话?你假装是租客,要租房子,他是中介。”
主播:“可以的,送热气球立马打。”
直播间很快出现“热气球”特效礼物,主播接单并打通对方提供的电话号码,同时手机开了免提,几声提示音后通话自动挂断。主播告知留言者对方不接电话,留言女生回复称:“知道了,谢谢主播。”对于主播来说,打了一次,就算完成任务了。电话打不通也算一单,照价收费。
记者围观一小时,主播共拨打了14通电话。
主播:“您好,这里是留言电台,你的朋友说暗恋你三年了,你过得还好吗?”
对方回复:“我有男朋友,祝他幸福!”
主播:“您好,您的朋友托我给您打个电话,我这边是情感电台代打电话的。她说好久不见,想问问你最近怎么样?”
对方回复:“我都不知道你是谁。”
该直播间“代打电话”多以表白、道歉、测试为主。其间,有网友问:“朋友欠我钱,可以打电话让他快点还吗?”主播回复:“咱不打这种电话,去找催收,我们直播间不讨债、不骂人,文明直播。”
深夜近百位主播在“代打电话” 整蛊、催债,还有打电话催人挪车
深夜11点多,扬子晚报紫牛新闻记者在某短视频平台搜索“代打电话”,发现有92位主播正在直播,约80%为女主播。很多账号直接命名为“代打电话”,有的则添缀“情感电台”“情歌传声”等。代打电话的方式基本都是关注主播账号,打赏一个“墨镜”或“礼花筒”,人多的时候得排队,送“热气球”可插队(墨镜价值9.9元,礼花筒价值19.9元,热气球价值52元),把对方的号码、称呼、想说的话私信给主播即可,然后主播一一打过去。
打过去之后,主播会先告诉对方,这里是代打电话的,然后主播把打赏者想说的话跟对方说一遍。也有不少直接挂电话,以为是骗子,或者是没打通的。
除了送祝福、表白、道歉、整蛊、测试,有的“代打电话”主播还提供骂人、讨债、催人挪车等服务。
一位来自福建的主播,粉丝有2.8万人,直播间有上千人在线,一场直播点赞有5万次,主播在直播间透露,她一天直播八个小时,打100通电话,跟上班没什么区别。记者算了一笔账,按照一个墨镜10元来算,平台扣一半,主播能赚5元,一天打100通电话,利润就是500元。
“代打电话”的主播们,有全职也有兼职。有位在大学宿舍里直播的女生直接表明自己是“大学生,兼职赚零花钱,希望大家多多点赞”。记者发现,并不是每个“代打电话”直播间都很火爆,一个刚开播两天的直播间人数只有十几人,主播一直在跟大家唠嗑,半个小时都没接到单。
入行4个月,挣了4万元 主播:在平台其实算“擦边”
主播巷子(网名)从2022年10月至今已直播了112场。偶然一次网上“冲浪”,他看到别的主播在直播间帮人代打电话,觉得应该会有市场,于是开始尝试。他告诉记者,这不算新兴行业,只是最近在短视频平台兴起,“早期电台就有这样的情感节目,热线电话打进去,主持人帮你打电话,把你不敢说的话传达出去。”
巷子说,帮别人打不敢打的电话,没有什么高深的套路,核心逻辑就是帮别人解决问题。“一般都是表白、道歉、分手、祝福之类的,找陌生人帮你打电话,一通只要10块钱,不是很贵却能满足自己的情感需求,下单人多也说明这块的市场需求还是蛮大的。”
巷子每天直播两三个小时,直播间人数从几十到几百不等,每次直播大概要打三四十通电话,4个月大概挣了4万元。“代打电话的主播时薪差不多在50元到200元之间,勤快一点、流量好一点的日入千元不成问题。”
巷子坦言,“代打电话”在平台规则里其实算有点“擦边”,他曾“因透露个人隐私信息或可能骚扰他人正常生活”的原因被平台封禁直播1天。“每个主播都有自己的底线,对于我本人来说,讨债、骂人的单都不接。‘代打’确实涉及到获取他人信息,但我不会非法使用这些信息。”
除了每天自己直播,巷子还教学生,上个月就收了七八个学员,每人收费几百元,教他们如何入门,“手把手教,我怎么做就教他们怎么做,一直到他们能独立直播,挣到钱为止。”他说,这行虽然门槛低,但想做好却不容易,“有一些运气成分在,这源于你直播间互动的内容,如果刚好你打电话过去,对话内容可以满足大家的猎奇心理,直播间一下涌进几千人都有可能,其实我们就是在直播间卖内容。”
律师:侵犯他人隐私权 主播、网友、平台承担不同法律责任
提供他人电话等信息是否侵犯他人隐私?整蛊、讨债、测试男女朋友等这种行为侵犯了他人什么权利,有哪些法律后果?主播、打赏的网友及平台需要承担不同的法律责任吗?
对此,扬子晚报紫牛新闻记者咨询了江苏圣典律师事务所饶奋斌律师。饶律师表示,首先,提供他人电话涉嫌侵犯他人隐私权。其次,对于主播代打电话问题,因涉及内容不同,所产生的法律后果也不同。饶律师说,如主播多次对他人实施整蛊行为或测试男女朋友的,干扰他人正常生活,公安机关可处拘留或者罚款;如主播辱骂他人,对他人实施侮辱行为,公安机关可处拘留或者罚款,情节严重的则涉嫌侮辱罪或构成寻衅滋事罪,依法应当追究刑事责任;对于讨债类型,如主播接受委托进行电话讨债,未实施辱骂行为,属于民事纠纷,如果半夜拨打电话,干扰他人正常生活则构成骚扰,应当受到行政处罚。
饶奋斌律师表示,网友进行打赏委托,若主播实施违法行为,网友与主播应当承担相应的法律责任。对于平台,如未落实主体责任,建立直播内容审核平台,则可能面临被警告、责令限期改正的法律风险。
(文图:赵筱尘 巫邓炎)