向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
江苏:“勇挑大梁”开创高质量发展新局面******
【深入学习贯彻党的二十大精神·高质量发展】
光明日报记者 苏雁
习近平总书记在党的二十大报告中指出,高质量发展是全面建设社会主义现代化国家的首要任务。在改革开放的市场前沿,在创新兴业的工厂车间,在满足人民美好生活需要的基层一线,各地区各行业牢牢把握高质量发展这一根本要求,坚定信心、积极作为,扎实推动经济不断实现质的有效提升和量的合理增长,为全面建设社会主义现代化国家开好局起好步。今日起,本刊推出“深入学习贯彻党的二十大精神·高质量发展”专题,分享新征程上开拓奋斗的故事,感受新时代的蓬勃生机。
冬春之交,一家家企业产销两旺的火热氛围,一个个工地机器轰鸣的建设场景,汇聚成江苏大地上最暖的风景。
1月2日,联合汽车电子有限公司江苏太仓公司二期工地上热火朝天。“7月,厂房就要竣工了!用于生产新能源汽车动力总成,以满足不断扩大的新能源汽车零部件需求。”联合汽车公司项目部负责人告诉记者。在他身后,是苏州新年第一个集中开工现场,工地上钢结构拼接的撞击声,吹响了春天奋进的号角。
2023年的苏州新年第一个集中开工仪式聚焦“新能源汽车产业创新集群建设”,总投资916亿元的142个新能源汽车产业项目,在苏州市域内集中开工签约或投产投用。“苏州要紧抓重要产业机遇、重大产业项目不放松,以分秒必争的冲刺状态夯实经济发展基础,扛稳江苏经济发展‘压舱石’重任。”会场上,江苏省委常委、苏州市委书记曹路宝的发言掷地有声。
苏州新年第一个集中开工仪式现场的火热场景,是江苏大地奋力开创高质量发展新局面的一个缩影。开拓进取,只争朝夕,8500万江苏儿女“勇挑大梁”,牢记习近平总书记殷殷嘱托,深入学习贯彻落实党的二十大精神和中央经济工作会议精神,统筹疫情防控和经济社会发展,坚定不移推动高质量发展,加快构建现代化产业体系,全面深化改革开放,展现新时代新征程实业报国、产业报国的江苏担当。
江苏中远海运特种装备制造生产车间,工人正在进行LNC罐箱生产。资料图片
1.敢为人先,跑出经济发展“加速度”
春江水暖。2022年岁末,江苏多个城市纷纷包机出国,带领招商团队和企业赴海外维护客户、争取订单。
一则则看似简短的信息,道不尽满载而归的喜悦之情——
12月5日,徐州组织4家外贸企业赴境外参加“中东迪拜五大行业展”,对接客商160余家,达成意向成交额260万美元;12月7日,南通64家企业参加2022日本东京亚洲纺织成衣展冬展,最终达成意向成交金额2亿元;12月9日,苏州赴欧经贸团30个招商小分队达成意向投资59.54亿美元,随行的外贸企业揽回订单约30亿元。
“赴海外招商引资拓市场,我们收获的不仅仅是项目和订单,还有继续扩大‘走出去’的强烈信心。”江苏长江纸业有限公司总经理顾丽感受颇深。欧洲之行她的公司拿到约1500万美元订单,远超预期,其中有1/3的订单来自新客户。
敢为人先,是刻在江苏人骨子里的先天基因。面对需求收缩、供给冲击、预期转弱三重压力,江苏各地在产业主赛道上彰显特色,实现优势互补、差异化发展。
地处江苏最北端的连云港,发力建设“一带一路”强支点。万吨级泊位已超70个,85条港口航线覆盖波斯湾、南非等地,串接起20条海铁联运通道及苏鲁豫皖内河港口。
一连串喜人的消息从四面八方传来。常州瞄准新能源汽车赛道,前瞻布局动力电池领域全产业链,涵盖电池材料等31个关键环节,新能源领域产值超5000亿元。扬州2022年百亿级重特大项目签约已达8个,超过此前十年的总和。建市只有短短26年的宿迁,全市经济总量由最初的全国第146位跃升至第75位,成为江苏乃至长三角地区发展速度最快、综合实力提升最明显的地级市之一。
江苏无锡一家企业的电动汽车生产线。资料图片
2.补链强链,打造“搬不走、压不垮、拆不散”的产业集群
2022年10月16日,党的二十大开幕前,党的二十大代表、江苏省昆山市委书记周伟亮相“党代表通道”。当有记者问及:“外界一直有外资撤离中国的言论,作为中国利用外资比较集中的地方,昆山是否遇到了类似现象?”周伟微笑着和记者分享了一个故事:“一家知名的光电企业,在2013年投资昆山13亿美元的基础上,新近又追加18亿美元的投资,持续增资昆山。”周伟还透露,今年8月,昆山已经提前4个月完成外资到账的全年目标任务。
在国际贸易和投资增长普遍乏力的当下,昆山为何有如此亮眼的表现?昆山给出的答案是,“产业链优势就是最大的底气。”
多年来,江苏坚守实体经济,把制造业作为高质量发展的根基,举全省之力打造一批“搬不走、压不垮、拆不散”的产业集群。
作为全国典型的老工业基地和资源枯竭型城市,产业强市是徐州发展的核心词。卡特、徐工等龙头企业发展迅猛,利勃海尔等名企纷纷布局徐州,这里正逐步构建起完备的“主机—零部件—后道服务”全链条协作关系。
专精特新“小巨人”企业专注于市场细分领域,是强链固链补链的重要一环。2022年,围绕16个先进制造业集群确定的重点领域和50条重点产业链的关键环节,江苏率先探索建立了创新型中小企业—专精特新中小企业—“小巨人”企业—制造业单项冠军企业的梯度培育体系。
南京市在全国率先出台支持专精特新中小企业参加政府采购的落地政策,对专精特新中的小微企业给予20%的价格抵扣,推动创新型企业厚积成势。无锡列出引进8000家科技型企业的发展目标,在全国多地建立了30多个科创飞地,投入30多亿元建立科创载体,供人才团队拎包入住。
近期,工业和信息化部公布了45个国家先进制造业集群名单,其中江苏占10席,涵盖软件信息、船舶、新材料、医药等重点产业。这些集群正成为驱动江苏制造由大变强的澎湃力量。
江苏苏州工业园区月亮湾全景。张倩摄/光明图片
3.集聚资源,创新活力奔涌不息
在近期召开的江苏省委十四届三次全会上,江苏省明确支持南京建设国家区域科技创新中心。江苏省委常委、南京市委书记韩立明说,南京要拥抱创新经济,更加突出前沿技术创新,奋力打造全国重要的区域创新高地和人才高地。
2022年,南京紫金山未来网络实验室发布全球首个“广域确定性网络系统”。该系统能为工业、无人驾驶、远程医疗等经济社会新场景提供定制网络服务。
近年来,江苏以攻克一批关键核心技术为突破口,不断提升产业集群创新水平,涌现出一批国际领跑或并跑的先进技术。在问天实验舱里,35款数万只(套)关键核心元器件来自中国电科第55研究所;神舟十五号载人飞船上,应用了江苏多家高校院所提供的配套技术;卡塔尔世界杯足球赛,从足球到电力工程到基建,江苏制造元素无处不在……
党的二十大报告强调,以国家战略需求为导向,集聚力量进行原创性引领性科技攻关,坚决打赢关键核心技术攻坚战。直径约10厘米、厚度只有0.35毫米……近日,在国家第三代半导体技术创新中心(苏州),记者见到仅三张A4纸厚度的碳化硅晶片。“这是第三代半导体的关键核心材料之一,看着不起眼,却是个实打实的节能高手。我们正在进行联合攻关,用它为新能源汽车打造国产‘功率芯’。”江苏第三代半导体研究院院长徐科介绍。
创新让企业向纵深扎根,不断优化的营商环境则为企业发展保驾护航。2022年岁末,在江苏智建美住智能建筑科技有限公司智美云工厂生产车间内,建筑模板正在快速组装成型等待发货。“2022年四季度,我们又接连收获了三笔优质订单,价值4000多万元!”企业运营总监李松歌告诉记者。
在企业心无旁骛抓发展的背后,一套惠企“组合拳”紧紧跟随。“当前,我们瞄准企业发展的难点和堵点问题,一方面,充分释放‘退、免、减、缓、降’等各项政策叠加效应,切实减轻企业税费负担;另一方面,积极帮助企业用好密集出台的金融政策,推动金融活水持续涌向企业发展的关键环节。”江阴市常务副市长王琪介绍道。
2022年,江苏先后出台“苏政40条”“助企纾困22条”等政策措施,极大地激发了各类市场主体的积极性和主动性。临近春节,江苏各地用“真金白银”助力企业稳生产稳就业。盐城市大丰区出台激励措施,对符合条件的规上制造业企业,按企业当月参加社保职工每人500元到1000元的标准进行奖补,单个企业奖补金额封顶50万元,助力经济“开门红”。
创新活力在江苏大地奔涌不息。数据显示,我国15.1%的领跑技术分布在江苏,1/5的高技术产品出口来自“江苏制造”。在全面推进中国式现代化的征途中,江苏儿女向着“强富美高”新江苏建设大踏步前进。
《光明日报》( 2023年01月11日 05版)
(文图:赵筱尘 巫邓炎)