(编辑/吕栋)
(资料图片仅供参考)
刚刚在上海闭幕的第六届世界人工智能大会(WAIC),火爆程度可谓历届之最。在会场上,一个值得关注的现象是,除了互联网大厂展出的更加通用的大模型之外,不少垂直领域的企业也推出了自己的垂直大模型,比如容联云发布了大语言模型“赤兔大模型”;达观数据推出了具有长文本、垂直化和多语言特点的“曹植”大模型;蜜度则正式发布自研的国内首个专为智能校对领域打造的垂直大语言模型——“蜜度文修”。
“通用大模型有很强的能力,但并不能解决很多企业的具体问题。基于行业大模型,构建自己的专属模型,也许是企业更优的选项。”腾讯云与智慧产业事业群CEO汤道生在会上提到,“伴随着大语言模型的发展,产业和社会,也将从数字化、网络化,走向智能化。
不完全统计显示,共有30多个大模型在本届WAIC上集体亮相,从不同维度推动人工智能从感知走向认知、从识别走向生成、从通用走向专用。模型火爆的当下,如何预判大模型发展趋势?会上发布的《生成式AI》报告认为,中国将出现比肩GPT-4的多语言通用大模型,当前生成式AI市场处于技术主导的早期阶段,存在千亿美元市值的平台性企业的机会。
在大模型的底层,算力和芯片扮演者关键角色。在本届WAIC上,华为携手伙伴联合发布了昇腾AI大模型训推一体化解决方案,加速大模型在各行业应用落地;作为“曹植”大模型国产战略合作伙伴,云服务厂商UCloud优刻得AIGC算力底座也在会上亮相。而天数智芯作为国产GPGPU的代表性厂商,在现场展出了通用GPU“天垓100”和推理产品“智铠100”。
天数智芯国产GPGPU产品 图源:观察者网
多个垂直大模型亮相,都有什么功能?
“大模型不是‘烟花秀’,而是要成为先进生产力,这一波AGI的革命是一场全新的‘元革命’。大模型对于产业发展来讲有非常重要的意义,有了大模型之后企业迎来了一个新的机会,实现了一种“端到端”的价值变现。”7月7日,在WAIC“AI生成与垂直大语言模型的无限魅力”论坛上,上海市数据科学重点实验室主任,复旦大学教授肖仰华指出。
在这场论坛上,达观数据董事长兼CEO陈运文发布达观数据“曹植”大模型,并正式对外开放公测。据介绍,“曹植”大模型具有长文本、垂直化和多语言的特点,通过并联多种模型和知识图谱,曹植大模型支持多种语言长文本的自动化写作和多语种翻译等功能,全方位赋能长文档写作、机器翻译、语义分析审核、知识问答、text-to-SQL等场景,可针对不同行业、领域的文案需求,进行深度优化和个性化定制。
区别于一问一答的简单短文本生成,“曹植”可准确完成多类型、复杂结构的长文本写作,自动起草多种类型的文档,同时具有自动排版、智能纠错、文本润色、自动生成摘要等特色功能;还将实现多模态内容生成,如长文档中的表格、图表、图片等;支持中文、英文、法语、德语、日语、韩语等数十种语言的写作,辅助人工大幅提高办公效率;在长文档翻译方面,对原文的标题、段落等内容实现 1:1版式还原,提供实时的翻译体验。
达观数据“曹植”大模型发布
7月8日,容联云在“生成式营销服务与大模型”论坛上,正式发布面向企业应用的垂直行业多层次大语言模型“赤兔大模型”,并发布容联云“生成式智能营销服一体化工作空间——机器猫”和“生成式一体化智能客服平台”,旨在推动企业营销和服务数智化转型。
论坛上,容联云AI研究院院长刘杰针对大模型AI能力的专业性和商业化落地发表主题演讲。据他介绍,“赤兔大模型”是容联云面向企业应用的垂直行业多层次大语言模型,通过重构智能客服和数智化营销价值,赋能沟通智能2.0时代。基于“赤兔大模型”,企业可以搭建自己的智能客服和数智化营销,完成从“降本增效”到“价值创造”的进化。
具体来看,“赤兔大模型”聚焦懂交流、会分析、有知识、能执行“四大能力”,适用于智能客服和营销等场景。依托“赤兔大模型”,企业客服可以实现多维度、细粒度的对话分析理解与内容生产,通过意见挖掘、情感分析、立场检测等洞察用户需求,同时,“赤兔大模型”还针对多种场景的人机交互应用,自动生成业务话术及流程方案、问答知识库,提升AI运营效率、客服效能及销售转化。其次,丰富的内部知识储备,和灵活的外部知识运用,可以解决大模型在真实性、即时性、逻辑性、可控性等方面的问题。
容联云发布“赤兔大模型”
“唐宋八大家之一的欧阳修曾任馆阁校勘,校对亦有修文之意,‘蜜度文修’便取名于此。”在会上,蜜度首席执行官翟光景正式发布自研的国内首个专为智能校对领域打造的垂直大语言模型——蜜度文修。蜜度文修以大语言模型(LLM)为技术底座,通过运用高质量数据学习多种特色子任务,大幅度提升中文校对和润色能力的智能化程度。科大讯飞与蜜度在大会现场正式合作签约,未来,双方将深化各自技术优势,携手推进智能校对产业的进阶,共同赋能行业生态,为更多企业及机构提供高质量的智能化校对服务。
算力是大模型发展的关键
算力是人工智能产业创新的基础,大模型领域的持续创新,驱动算力需求的爆炸式增长。大模型训练的时长或者创新的快慢,根本上取决于算力的大小。
“没有大算力,做大模型就是天方夜谭。”本届WAIC期间,中国工程院院士、鹏城实验室主任高文在昇腾人工智能产业高峰论坛上演讲时直言,使用算力训练大模型,就像工业中使用电力一样,想靠省电做出产品,真正懂行的人听了都不信,大模型一定要有算力作为基础。
华为轮值董事长胡厚崑在会上提到,华为在各单点创新的基础上,充分发挥云、计算、存储、网络、能源的综合优势,进行架构创新,推出了昇腾AI集群,相当于把AI数据中心当成一台超级计算机来设计。目前,昇腾AI集群解决方案已经在全国25个城市的人工智能计算中心及重点实验室得到应用,其中有7个,包括武汉、西安等,成为科技部首批认可的“国家新一代人工智能公共算力开放创新平台”。我们也助力中国移动、科大讯飞、南方电网等领先企业,构建企业坚实的算力基础设施,加速企业的智能化转型。
作为达观数据“曹植大模型”国产战略合作伙伴,UCloud优刻得AIGC算力底座也在本次大会亮相。在“AI生成与垂直大语言模型的无限魅力”论坛上,优刻得董事长兼CEO季昕华发表了“中立安全云计算助力大模型发展”主题演讲,介绍优刻得在AIGC领域的技术产品、工程能力和生态建设等发展情况。
优刻得 AIGC 私有化方案架构图
优刻得在本次WAIC上展出AIGC解决方案全景图,并推出涵盖数据中心、计算平台、管理平台、网络服务、应用服务、生态接口的一系列产品和解决方案。开放、安全、定制的AIGC解决方案让客户既能利旧已有服务器资源,又可以便捷享受公有云的弹性扩容,实现IT层面的降本增效。并可通过数据中心托管专区,为用户提供完全物理隔离的独享机柜、服务器、网络、存储资源,结合完整的安全方案和专家服务,确保了用户的大模型平稳运行。
在英伟达强势的市场地位下,国产GPU的落地问题,一直是困扰国产AI算力提升的挑战。不过令人欣慰的是,在一定的技术积累下,一批初创国产GPU厂商已开始崭露头角。
天数智芯展台
过去两年,天数智芯先后发布了通用GPU训练产品“天垓100”和推理产品“智铠100”,并经过多家合作伙伴的适配验证,在应用落地层面已有显著成效,尤其是在大模型领域,该公司在上半年搭建了搭建40P算力320张天垓100加速卡算力集群,完成智源研究院70亿参数大模型全量训练,是目前唯一能支持大模型完整训练的国产通用GPU产品。
本届WAIC上,天数智芯展示了在大模型训练、推理所取得的显著进展,其中图片识别/以图搜图、3D 建模、大模型推理等展点吸引了众多目光。同期展出的智慧零售、智能 OCR、智算中心、目标检测等多种应用场景同样吸引了参观者驻足观看。