向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
乡村之变如糖入水——读付秀莹长篇小说《野望》******
作者:贺绍俊(沈阳师范大学特聘教授)
付秀莹爱自己的家乡,家乡也馈赠她丰厚的文学。她携带着家乡的泥土芳香一路走来,在她的文学田野里搭建起一个充满烟火气息和人间温馨的“芳村”。从《陌上》到《野望》(北京十月文艺出版社2022年5月出版),付秀莹深情地讲述着芳村里的人和事。她讲述的是普通农民日常地过日子。在她的讲述中,芳村里的家长里短、柴米油盐,还有院里的鸡和屋里的娃,都变得生机盎然、活色生香。她先是在《陌上》以主人的姿态热情领着读者来到芳村串门,倾听兄弟姐妹们的唠叨,也分享他们的喜怒哀乐。接着到了《野望》,她则是“深扎”到一户人家,陪着翠台一家人度过了一年的岁月。在这一年里让我们看到,乡村人家在新时代精神的润泽下是如何将日子过得越来越精彩的。
作家采取的是典型的日常生活叙述方式,她的句式是短促的,这使她的叙述很像是在与亲人絮叨唠嗑,具有浓郁的日常性和人际交流的亲切感。不得不佩服付秀莹的叙述能力,她这两部小说都是在讲述芳村的家常事,看似平平淡淡,没有什么戏剧性冲突,却是有滋有味。仔细读了付秀莹的小说,才明白这还不完全是由于她的叙述能力强,更由于她对乡村的日常生活有感情、有体会、有思考。付秀莹的思考始终贴着乡村的伦理精神而展开。乡村是以家庭为中心的生产生活方式,血缘和地缘是农民进行人生价值判断的两大基础。以血缘和地缘为主调的乡村伦理精神就像黏合剂一样协调着乡村人际关系。付秀莹在《陌上》这部小说中将此表现得十分充分。而在《野望》中,她则是对乡村伦理精神作了进一步的思考。她思考的重点是:在新时代和新生活的背景下,乡村伦理会面对什么样的挑战,会发生什么样的变化。
付秀莹专门挑选了翠台一家为代表来看乡村的变化。翠台一家是很普通的一家,丈夫根来是一个老实本分且很勤劳的农民,他养了十几头猪,是村里少有的几个养猪专业户之一。翠台里里外外地忙着,既要操持好家里的一切,还要关照好公公婆婆的生活。儿子大坡、儿媳爱梨和孙女一家三口和他们住在一起,其乐融融。小说的开头正是小寒节气,芳村的家家户户都在热热火火地准备过年。小说的主人公翠台出场了,她像往常一样吃罢早饭要到她爹那边的院子里去。但她爹的一句话,才让人们了解到,看上去像往常一样的翠台其实心里藏着焦急的事,她的儿媳妇因与儿子拌嘴竟连夜带着孩子跑回娘家去了。这看似无非小两口拌嘴的小事,付秀莹却将其写得一波三折、跌宕起伏,而这一切又都是贴着日常生活去写的。一方面,翠台担心儿媳妇一生气不回来过除夕了,另一方面,要请谁去劝她回来才合适也颇费思量。这对一个农村家庭的主妇来说,都是关乎情面的事情。如果儿媳妇过年没回来的话,这会让全家在村里颜面尽失;至于请谁去劝,则涉及关系亲疏、作用和影响的大小等问题。该请的人都请了,翠台还专门去庙里烧了香,但对方丝毫不听劝。翠台正一筹莫展时,儿媳妇却主动打电话给她丈夫,让丈夫接她回家,全家仿佛啥事也没发生过似的,高高兴兴地准备过大年。回家与不回家,其实背后都是乡村伦理在起作用。
说到底,这不过是一桩小家事,付秀莹却将其写得风生水起、有滋有味。这是因为她懂得滋润乡村日常生活的活水在哪里,看似琐碎的日常生活叙述并不令人读来有枯燥感,就在于她顺着这股流淌着的泉水去写,让叙述富有湿漉漉的灵动性。这股泉水其实就是乡村伦理精神。因此可以说,付秀莹在《野望》中延续了《陌上》的主题。但在《野望》里,乡村伦理精神的这股泉水跳荡得更加活跃了,时不时地掀起了小浪花。这是因为农村不断发生新的变化,不断涌入新的材质、新的现象。就像这次翠台的儿子和儿媳闹出的小风波就是因为年轻人有了新的生活追求,他们也不会像长辈那样习惯于在传统伦理要求下约束自己的言行了。付秀莹在这部小说里就是要表现出,当农村面对新时代和新变化时,乡村伦理是如何处理日常生活矛盾的。乡村生活看上去平平静静,其实不断有新的东西在叩击着人们的内心,让人们内心泛起涟漪。当乡村的日常生活中加入了越来越多的新观念、新习俗时,乡村伦理关系必须作出相应的调整,否则人们面对新的东西会“消化不良”的。比如翠台的婆婆看到老牛他娘要听自己媳妇的遣使时,便感慨“多年的媳妇熬成婆”这句老话如今不灵了。有意思的是,她是当着翠台的面说这句话的,突然意识到给媳妇说这话不妥当,“忙装着往灶膛里添柴”来遮掩过去。从这个小细节就能看出,乡村日常生活悄悄地发生了变化,老人一边抱怨现在的媳妇不听婆婆管了,一边又不敢在自己的媳妇面前耍婆婆的威风。付秀莹选择翠台这样一位普通农村妇女作为主角,是从细微的角度来表现现实的新变化的。新变化不仅是宏大的工程,而且也渗透在日常生活的油盐酱醋之中。翠台这一年来没少经历疑惑和烦恼,大多都与她还不适应新变化有关。她的女儿就令她越来越难以琢磨。比如女儿的手机不让她看,说这是隐私。又比如她本来指望女儿读了大学能留在城市,给全家增光,却没想到女儿表示毕业后要回到芳村,这真让翠台完全看不懂这个世界了。可是,翠台并没有被接踵而至的新东西弄得“消化不良”,这是因为在乡村伦理中增添了很多的“益生菌”,帮助翠台有效地将新东西吸收到日常生活中。这“益生菌”也许是女儿从学校和城市携带过来的,也许是村头那只大喇叭传递过来的,当然更应该是为丈夫养猪分担了风险的合作社政策颁布过来的。“益生菌”让乡村伦理更加完善,也更加和谐。
付秀莹在《野望》中的时间设置十分讲究,她以中国传统的二十四节气作为小说的时间节点,演绎了芳村一年的光阴。小说讲述的故事分明是当下现实的,却又模糊了现实时间的具体所指。可以说,付秀莹采用的是芳村特定的时间,一方面,芳村人在心理上还遵循着传统的时间理念,另一方面,芳村的现实又紧随着时代的节奏。付秀莹便是在这样的情境中去书写乡村日常生活的,日常生活仍然像一条平淡的河水,然而新时代的变化就像糖溶入了水中,我们品一品付秀莹的叙述,就能感觉到丝丝甜味。
《光明日报》( 2023年01月11日 14版)