《阿凡达2》海报
动画版《三体》剧照
外星球:蕴藏无限可能
奇幻绚丽的水下景观,千姿百态的海洋生物,震撼人心的海底冒险……《阿凡达2》日前登陆影院,带领观众重返潘多拉星球,探索神秘未知的海底世界。
水之道,连接万物。蔚蓝蕴藏着无限可能,欢迎来到潘多拉星球的全新海域。这个神秘的外星球拥有奇特的地质构造,一座座云雾缭绕的山峰悬于空中。在奇幻风光中,众多奇特的地外生物陆续登场。凭借影片多年来在全球的热度和欢迎度,《阿凡达》里的潘多拉星球,成为光影世界中知名度极高的外星球。13年后,《阿凡达2》继续续写潘多拉星球的传奇,故事背景从热带雨林转向神秘的深海世界。影片精彩的视觉效果获得众多赞誉,有网友评论:“拍得好像去外星取过经。”
去年12月,动画版《三体》上线,该片改编自著名科幻作家刘慈欣同名长篇科幻小说,是三体宇宙这个国内顶级科幻IP的首部影视化作品。这部动画片上映后口碑两极分化,目前豆瓣评分仅为5.0。但是,可以肯定的是,该片又引发了新一轮“三体热”。
除了众所周知的潘多拉星球、三体星系外,还有许多外星球给观众留下深刻印象,包括《星际迷航2:暗黑无界》中的尼比鲁星、《沙丘》中的厄拉科斯星、《大黄蜂》中的赛博坦星、《星际特工:千星之城》中的千星之城阿尔法、《星际迷航3:超越星辰》中的约克城等。
《星球大战》中的科洛桑星球,是片中银河共和国与此后的银河帝国的首都,星球形象很符合许多人对未来世界充满科技感的幻想。在阳光照射下,科洛桑星球犹如一个能反射出奇特银色光芒的金属球体,“科洛桑”这个名字,即有“闪耀之城”之意。整个星球表面被城市景观及四通八达的交通网所覆盖,摩天大楼高耸入云,悬浮车交叉往来绵延不绝。
“厄拉科斯——沙丘——沙漠星球。”在《沙丘》中,人们眼中的外星球就是行星厄拉科斯的模样。这里是人们梦寐以求、竞相抢夺的“香料”的产地,人们常常用另一个名字呼唤这个干旱的星球——沙丘。家破人亡、颠沛流离的少年保罗在这个宇宙间最危险的星球与命运不断抗争。
科幻片中的外星世界,充满了人类对外星球的绚丽想象,也映射出人类对未来命运的探索和忧思。随着科幻片制作水平的不断提升,人们对外星球的想象越来越天马行空,必须借助CG技术(利用计算机技术进行视觉设计和生产)来合成。不过,从许多科幻片中总能看到一些地球上的风景。例如,《阿凡达2》中,高耸入云的潘多拉星球丛林世界在设计时就参考了我国桂林、张家界的地貌。
神奇生物在哪里?
“仰观宇宙之大,俯察品类之盛,所以游目骋怀,足以极视听之娱,信可乐也”,我国著名书法家王羲之在《兰亭集序》中描绘宇宙景观的古文,去年出现在意大利女航天员萨曼萨·克里斯托福雷蒂的社交媒体上,她在发布一组太空摄影作品时配发了上述文字。
从古至今,仰望星空时,人们常常会产生这样一些疑问:地球之外的宇宙世界是什么模样?地球之外的其他星球上,是否有外星人等外星生物存在?
关于外星人的描述,在中外科幻小说、影视作品中层出不穷。在众多影视作品中,哪个外星人给你留下了最深刻的印象?是《阿凡达》中的纳美人,还是《E.T.外星人》中意外走失的小外星人;是《星球大战》中的尤达大师,还是《变形金刚》中的擎天柱?
科幻片中的外星人一般分为以下几种类型:一是入侵地球的怪兽型,通常出现在外星人入侵地球、与人类大战的故事中;二是拯救地球型。在《地球停转之日》(1951)中,外星人来到地球警醒人类关心自己和地球的命运;三是不得不流落到地球的“外星难民”;四是与地球人类友好相处的外星人,小外星人E.T.就是其中的典型代表。
科幻片中,除了外星人外,外星球上还有许多奇特的外星生物。《阿凡达2》里,潘多拉星球上的发光生物令人印象深刻;纳美人乘着掠波翼龙、伊鲁,穿越风暴徜徉在海中;图鲲迁徙的场景配上气势磅礴的音乐,给观众带来震撼的视听感受。这种体型庞大的海洋生物上天入海,让人不由联想起庄子在《逍遥游》中所说的“鲲之大,不知其几千里也”。
科幻片的终极提问
人们常说的“硬科幻”和“软科幻”,主要根据科学技术在科幻片中的“硬核”程度来划分。其中,“硬科幻”指严格遵守数学、物理等科学定律的科幻故事,具有科学的合理性与严密的逻辑性;“软科幻”则不太强调科学的严谨性,有时甚至只是运用一些科技元素对影片故事进行“点缀”。
刘慈欣在科幻小说《三体》中,从恢弘的角度展现了地球文明以外的“三体文明”,并由此引出地球文明在宇宙中的兴衰史。由众多科幻片搭建的奇幻世界中,人们反复探讨人类和地球的命运和未来、外星人与地球人能否共处、地球文明和宇宙文明的相互关系等,同时也展现了剧中角色的复杂和多面,关于权术与背叛、恐惧与仇恨、贪婪和欲望、智慧和勇气、希望与梦想的一幕幕不断上演。在科幻片的外壳下,影片内核不断变化,衍生出众多科幻片亚类型,包括科幻+警匪、科幻+爱情、科幻+悬疑、科幻+喜剧、科幻+战争等。科幻片的形式和内容虽然不断变化,但是经常反复探讨的只有一个终极提问:假如科幻片中的灾难性危机变成现实,人类应该如何应对?
刘慈欣曾提出“大灾难中,拯救人类的唯一力量就是科学技术”等观点。《流浪地球》中,太阳系已经不适合人类生存。面对绝境,人类开启“流浪地球”计划,试图带着地球一起逃离太阳系寻找新家园。在动画版《三体》中,“三体人”的母星即将毁灭,殖民地球是这个遥远文明仅存的希望。为了应对危机,地球上的人类成立了最高指挥系统。该片一开篇就是令人震惊的“古筝行动”。人类在巴拿马运河两侧立起由纳米丝构成的切割网,将“审判日”号邮轮进行切割。
科幻片以人类的科学理论为基础,凸显出强烈的科学精神和忧患意识。科幻对科学的预见性和反思性,启迪人们探索更多星辰大海的奥秘,这道光将持续照亮人类的征途,宇宙探索永无止境……(徐珊珊)
原标题:《三体》动画、《阿凡达2》上映,引发人们对科幻片的热议——游目骋怀,仰观宇宙之大
向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
(文图:赵筱尘 巫邓炎)