首页>推荐 > 正文

生成式人工智能如何站在潮头?川企给出创新答案丨寻新记⑨

2024年04月07日 09:28
评论

每一次技术革命都在悄然改变着人类社会的面貌。随着ChatGPT、Midjourney等AIGC应用的火爆,生成式人工智能得以走出学术圈的象牙塔,飞速渗透到大众的工作和生活中。

3月,寻新记报道组走进成都恒图科技有限责任公司、成都万木健康科技有限公司。从“PhotoShop继任者”到遍布北上广医院的医疗数字人,在这些创新实践的背后,人工智能如何促进新质生产力加快形成?

从智能工具到普惠科技,新质生产力的价值追求

在成都青羊区的一栋写字楼内,一群程序员正在调试着最新的图形处理程序。从他们手中流出的每一行代码,都将流向全球,为全球数亿名用户所使用。

如今,恒图科技的Fotor等产品已经在全球200多个国家和地区发布,拥有超过6亿的海外用户,每月有超过1500万活跃用户使用Fotor等产品。在美国、英国、德国、法国等全球GDP排名前10的国家中,Fotor的占有率已经超过Picsart、Photoroom等新一代的图像处理产品,拥有较高的市场占有率。

在一项国际权威数据公司对全球超过5000个AI应用的排名中,Fotor的用户数在全球排第23位,超过了百度、腾讯、阿里等大厂的AI产品,在所有国产AI产品中排名首位。

2012年,早在大多数企业还在移动互联网时期讨论“用户规模”和“流量变现”时,成立仅3年的恒图科技已经在正式发布“Fotor”,具备HDR(高动态范围图像技术)、单反相机原始图像文件AI技术、一键图像增强技术。

2022年,当扩散模型(Diffusion Model)技术的革命性潜力初现端倪之际,恒图科技捕捉到了这一技术浪潮的战略机遇。扩散模型所代表的文本-图像生成范式,用在视觉生成任务上,如图像超分辨率、去模糊等,为设计创意行业带来一次范式级的变革。恒图科技迅速行动起来,在Fotor平台上率先上线了基于扩散模型的AI图像生成功能。大量用户涌入Fotor平台,体验AI赋能下的“零门槛”设计创作。短短一年的时间,Fotor的月活跃用户数实现大幅增长,从百万量级一跃至千万量级。

如果说图片领域的突破是恒图科技在AIGC领域的初次试水,那么视频领域的探索无疑是恒图科技的又一大布局。

年初爆火的Sora再一次在AIGC领域掀起了一场技术竞赛,国内外已有多家科创公司和互联网科技大厂下场布局。“图像和视频技术具有通用性,同时基于视频用户的需求持续增长,公司决定布局AI视频。”成都恒图创始人、西南财经大学教授、博士生导师段江表示。今年1月,恒图科技在全球上线了一站式AI长视频制作平台——Clipfly,集合了AI视频生成、AI视频增强、视频编辑等功能。

Clipfly提供一站式AI视频平台,集成文生图、图生视频、视频编辑等功能,使用户能够在一个平台上完成从产生创意到完整视频的所有工作。

从最初简单生成3秒左右的视频,到实现5秒的突破,再到现如今45秒的长视频,包含细腻复杂的场景、生动的角色表情以及多个运动镜头,画面可以以假乱真。短短几个月,Clipfly已在海外拥有10万名用户。

段江介绍道,即使是复杂场景的视频,制作成本约在40美元左右,相较于此前需要专业级影棚、专业图形处理软件数以百万计的成本,实现了降本增效。

从提质到赋能:AIGC开启新质生产力

如果说恒图科技的探索代表了AIGC在创意产业的应用突破,那么万木健康的实践,则为我们描绘了一幅智慧医疗的全新图景。

走进成都天府软件园的办公楼内,一块绿幕前,一位医生正在采集自己的身体数据,在几分钟之后,属于自己的数字人形象就会出现在小程序上,身穿白大褂,俨然自己的电子分身。这样的技术,如今已经走进北京、广州等地的用户身边。

Kantar凯度咨询联合腾讯医典调查显示,42%的普通民众平均每周会观看1-3次健康科普视频。而医护人群方面,67%的医生今年观看医学线上课程和学术会议次数较往年有所增加。如今的医学内容开始沿着“互联网+”时代的风口逐渐向线上、数字化、视频化迁移,医学内容正在被媒介重新定义。

“在医疗领域,视频科普和患者教育赛道目前还处于早期萌芽阶段,其专业性和规范化程度都有待提升。”在万木健康创始人、CEO程锦看来,其中的关键在于打造“永不下班”的智慧医疗大脑,并借助AIGC、超写实数字人、区块链等前沿技术,为医患互动、医学教育、临床研究等场景提供智能化解决方案。

通过将临床医生的专业知识与人工智能算法深度融合,万木健康构建了一个高度拟人化、专业化的智能医疗服务平台。在这个平台上,数字医生可以通过自然语言交互,为患者提供个性化的诊疗建议和健康指导,既降低了医患沟通的成本,又提高了基层医疗的服务质量。

医生只需要利用空闲时间,拍摄3至5分钟的视频素材,万木健康便能进行自主学习和训练,生成一个高度拟真的“数字分身”。此外,只需录制30句语音,系统就能快速采集到医生的声音特征,赋予数字分身以鲜活的“人格”。即使是临床一线繁忙的医生,也能轻松打造专属的数字化身。

这种“所见即所得”的内容生产方式,极大地降低了医生进行视频科普和患者教育的门槛。哪怕是利用碎片化的时间,医生也能轻松制作出专业、权威的医学视频内容。

今年1月,国家互联网信息办公室发布第三批境内深度合成服务算法备案清单,成都万木健康科技有限公司等多家企业通过备案。如今,万木健康已经与全国范围内超过2000位医生展开合作,医生均拥有三甲医院、副高职称以上的高层级资历。程锦认为:“我们的目标不是医疗版的ChatGPT,而是为医院里每一位活生生的医生打造专属的数字分身,让他在不同的应用场景里面去产生价值。随着新技术的迭代,未来这个数字分身会逐渐衍生为AGI(通用人工智能)经过训练,最终将成为医生的超级助理。”

人工智能成为四川科技创新1号工程,企业如何把握机遇

人工智能是引领新一轮科技革命和产业变革的核心力量之一,正以前所未有、超乎想象的速度和冲击力重塑世界。

当前,四川省人工智能产业快速发展,以成都为例,人工智能综合发展水平已达全国第7名,拥有优势创新主体40家,高能级创新平台26个,创新领军团队30个。此外,还配备国家新⼀代人工智能创新发展试验区、国家人工智能公共算力平台、天府绛溪实验室等多个高能级平台。

发展人工智能,谁看得准、抓得紧,就能抢先⼀步、掌握主动。

近年来,成都市先后印发《成都市加快人工智能产业发展推进方案》《成都市新一代人工智能产业发展规划(2022—2025)》,今年开年后又出台《成都市关于进一步促进人工智能产业高质量发展的若干政策措施》专项政策,与《成都市促进大数据产业发展专项政策》《成都市围绕超算智算加快算力产业发展的政策措施》共同构成人工智能“算力+算法+数据”的政策体系。

“现如今几乎所有的科技创业公司都贴上了AI的标志,都要和AI产生联系,AI是四川今年的科技创新的一号工程,四川省正在以超常规最大力度精准支持,由此可见AI的重要性。”段江提到。

在他看来,在过去的二三十年,科技行业经历了三次重大的技术创新:20世纪90年代末到21世纪初,PC端大概花了20年的时间渗透了75%的人群;而移动互联网则在过去10年间渗透了75%的人群;从2022年开始,AIGC已经在短短两年的时间里接近了75%的渗透率。AIGC时代已经到来,但一款属于时代的超级APP还没有出现,这背后其实是巨大的创新创业浪潮。

而推动这场智能革命的核心动力,正是新质生产力的崛起。正如程锦提到,新质生产力的概念并非突然出现,而是随着颠覆性技术的出现而自然萌发的生产力的革新。在技术的快速迭代之下,人工智能将进一步推动新质生产力的发展,并最终走向AGI。

实际上,恒图科技和万木健康只是四川快速发展的人工智能产业的一角,还有更多企业在各自领域不断探索和创新生成式人工智能的应用。

例如,成都潜在人工智能科技有限公司推出游戏领域自研算法并推出AI虚拟玩家、内容审核、AI美术、AI音乐等AIGC产品;智慧途灵科技(成都)有限公司帮助四川大学原子与分子物理研究所利用自有数据进行训练打造学科“私脑”;成都阿加犀智能科技有限公司在行业内首创AI推理平台,提供开箱即用AI工具链让芯片算力发挥更简单;这些企业的创新发展,均折射出四川乃至全国人工智能产业蓬勃向上的生机活力。而这些企业折射的正是人工智能赋能新质生产力、重塑产业图景的缩影。

人工智能正是这一轮科技革命和产业变革的驱动力,它所带来的不仅是技术层面的突破,更是生产力形态、生产关系乃至整个社会形态的深刻重塑。从这个角度来看,AIGC的快速崛起,为这一趋势按下了“加速键”。

记者:温彦博 罗曙驰 尚志

来源:封面新闻


0

评论

0 条评论 手机发评论