文:Jenny Xiao (肖文泉)、Jay Zhao
去年12月,ChatGPT火爆出圈,资本和科技界迅速开始讨论AIGC技术的潜力和前景。而中国和硅谷很快成为了这场讨论的中心。
AIGC在硅谷持续升温,众多顶级VC纷纷发布相关行研。2022年9月,红杉资本发布了一篇叫做《生成式AI:一个创造性的新世界》的文章,指出AIGC应用将在未来几年大量落地,AI生成的文字、图片、视频将逐渐走入人们的生活。
今年春节刚过,腾讯研究院又推出《AIGC发展趋势报告2023:迎接人工智能的下一个时代》,预测未来五年10%-30%的互联网图像将由AI生成,AIGC市场到2030年可能达到1100亿美元的规模。
不少业内人士认为中国的AIGC产业处于发展的初期,底层技术和应用层面和国外还有较大的差距。虽然国内众多厂商开始布局AIGC,但是目前的商业模式还不成熟。技术层面的不足也限制了应用端的发展。
但事实上,中国是美国市场之外唯一一个拥有完整的AIGC产业链的国家。中国的AIGC产业很可能发展出和硅谷完全不一样的生态系统。
今天,我们就带大家来深入解析对比中国和硅谷的AIGC赛道,看看国内的AIGC行业和国外到底有什么区别,未来又会有什么样的发展趋势。
当全世界把目光放到了ChatGPT上时,中国的AIGC模型也正在飞速发展。
从AIGC模型数量上来看,全世界前十的AIGC模型研发者中,中国机构占了四个。其中有学院派的BAAI智源研究院和清华大学,也有产业界的百度和阿里巴巴研究院。顶级的西方AI机构谷歌、Meta还有OpenAI当然也榜上有名。值得一提的是,除了英美之外,虽然以色列有AI21,加拿大有Cohere,只有中国有多家机构在研发AI模型。
平安银行:深度借助区块链等科技手段加快推进数字化经营:10月21日消息,平安银行股份有限公司发布2021年第三季度报告。报告中指出,依托平安集团“金融+科技”优势,深度借助人工智能(AI)、区块链、物联网等科技手段驱动业务创新,加快推进数字化经营,支持全行业务均衡发展及零售转型战略落地。
平安银行“星云物联网平台”深度融合中台化、敏捷化理念,基于物联网、AI、云计算、区块链等技术,实现数据“采集、确权、溯源、验真”,有效解决银企信息不对称痛点,提升产品线上化、模型化和自动化水平,打造场景属性强、科技属性强、经营模式轻的供应链金融。[2021/10/21 20:46:01]
中国企业近几年在自主研发上下的功夫也为AIGC产业打下了基础。比如,百度的飞桨PaddlePaddle和华为MindSpore开源框架。这些框架和国外常用框架(比如TensorFlow和PyTorch)的不兼容可能会限制国产框架的发展,但是例如Ivy这样的框架转换器或许能成为中西方AI框架的桥梁。
在社区层面,在2013年开发出来的Gitee成为了号称“中国GitHub”的开源技术社区。如今,很多大模型都在Gitee上开源,比如中科院的紫东太初大模型。Gitee社区也吸引到了超过800万开发者用户。可见Gitee社区和国产框架都成为了中国AIGC发展不可或缺的软件设施。
在硬件层面,国产的芯片也称为了训练AIGC模型的常见之选。在训练2000亿参数的超大盘古模型的过程中,来自华为的团队调用了超过2000块华为昇腾910芯片。而2600亿参数的百度ERNIE 3.0 Titan还有千亿参数紫东太初模型也是在华为昇腾系列的芯片上训练出来的。
Bitstamp推出新服务INSIGHTS,以提供市场深度信息:交易所Bitstamp在推特上宣布推出新服务INSIGHTS,旨在为用户提供加密市场的深度信息,其数据由IntoTheBlock提供。[2020/7/29]
AIGC模型十大开发机构
从预训练语言模型的参数量来看,很多中国的模型其实并不比西方逊色。但是站在用户体验的角度,ChatGPT确实要领先于中国的语言模型,还有西方其他公司的模型。中国的开发者总能够赶上西方的领头羊,但是这个技术追赶的过程却需要2-3年。比如,OpenAI在2020年6月推出GPT-3模型,中国的智源、华为、百度在差不多一年之后才研发出了体量与之相当的模型,又用了一段时间才让模型的技能和GPT-3相媲美。
预训练语言模型参考量
在一定程度上,中国的AIGC底层技术也受益于西方的开源运动。在StabilityAI发布Stable Diffusion模型之后不久,国内的IDEA研究院封神榜团队很快就训练出了名为“太乙”的中文版Stable Diffusion。与原版的Stable Diffusion不同,太乙Stable Diffusion可以更好地理解中文的语言文化环境。
极豆资本与Era Lab International达成深度战略合作:据官方消息,5月25日极豆资本与美国Era Lab International创投基金达成深度战略合作关系。同时,极豆资本将聘请Era Lab International联合创始人Michael Liu、Ryan Li担任极豆资本旗下东南亚区块链智库联席主任。
据了解,Michael Liu,博士学位,毕业于麻省理工大学、剑桥大学,持有多项智能算法方向发明专利;Ryan Li,毕业于南加州大学(USC),拥有CFA(特许金融分析师)和美国CPA(美国注册会计师)。[2020/5/25]
在之前的一篇文章里,我们分析过美国的AIGC产业,提到了希望很多AIGC垂直领域已经杀成了一片红海。比如,文案编辑和市场营销领域的文字生成类产品已经有数十家创业公司在做了。图像生成类的产品在Stable Diffusion和DALLE-2出现之后也迅速开始卷了起来。
然而,中国的AIGC产业大多还是一片蓝海。两张市场地图对比不难看出中国的AIGC公司要比西方少得多,有些领域甚至还没有出现很多初创公司。
中国的AIGC市场地图
CoinBene俄罗斯分站与媒体BitNevoy达成深度战略合作:据官方消息,CoinBene满币与俄罗斯媒体BitNevoy达成深度战略合作,双方将围绕虚拟货币合约交易、全球市场宣发、资源对接、渠道商招募以及全方面业务拓展展开全方位合作,帮助用户有更好的合约体验。
BitNevoy是集行业新闻、资讯、行情等一站式区块链服务于一体的俄罗斯知名区块链媒体。
CoinBene满币数字资产交易平台在全球180多个国家和地区拥有500多万用户,日活跃用户数超10万,日均交易额30亿美元。2019年初,平台战略布局合约衍生品市场,主要为投资者提供以BTC、USDT进行结算且安全、稳定的永续合约服务,CoinBene满币将继续深化与社区、媒体合作。[2020/5/14]
西方的AIGC产业是不是比国内要拥挤很多?
这一方面是由于中国的底层技术要比美国落后几年,还不足以支持商业化落地。就在几年前,李开复老师在《AI Superpowers》一书里指出,中国虽然在AI技术层面不及美国,但是在应用端却走在了美国的前面。或许这一说法适用于预测型AI(“predictive AI”,比如人脸识别、推荐算法)的时代,但是在生成型AI(“generative AI”)的时代,应用和底层技术结合得更紧密,中国在应用方面也可能要追赶美国的步伐。
中国在应用层的滞后也是由国内B2B产业的特性决定的。西方的文字和图像生成类产品主要都是面向2B的市场的,而中国的B2B市场要比西方小很多,中国企业往往不愿意在软件上花钱,而更愿意去购买服务。这就极大地降低了初创公司想要进入2B类文字、图像生成SaaS赛道的意愿。我们未来在国内可能看到企业打着卖服务的旗号卖软件--用户的体验和买服务无异,而后端的服务却是由AI软件提供的。
声音 | 哈尔滨市委:推进区块链等技术与实体经济深度融合:在25日召开的哈尔滨市委十四届七次全体会议上,哈尔滨市委提出,明年重点抓好六个方面工作,紧扣全面建成小康社会目标任务,分别为坚决打好三大攻坚战、推动经济高质量发展、统筹推进乡村全面振兴、聚力攻坚改革开放、推进新区和自贸试验区联动发展和织密扎牢民生保障网。其中,推动经济高质量发展中,要推进工业强市,大力发展数字经济,推进互联网、大数据、人工智能、区块链技术与实体经济深度融合。(黑龙江日报)[2019/12/26]
另外,与美国横向SaaS模式不同,中国的AIGC的SaaS很有可能会采取纵向的发展模式。这种模式的特点在于,聚焦于特定的应用领域,比如电商、短视频、金融,而不是追求产品的通用化。这种发展模式弥补了中国在模型通用能力上的不足,也利用了在垂直领域积累的大量的专业数据。
中国市场的独特性也决定了中国会发展出和西方不一样的AIGC生态系统和不一样的垂直应用。
这意味着中国的AIGC应用虽然比美国慢了一步,但是简单粗暴的“复制到中国”(“copy-to-China”)模式并行不通。还是拿文字生成领域来讲,中国高质量的数据集少、市场营销以视频形式为主、企业不愿意在软件上花钱,这就意味着类似于美国的Jasper.ai和copy.ai这样的文字生成的通用SaaS,在中国就很难获得很大的2B市场。
中国文字生成产品主要在做2C的业务,并且业务的性质也和美国很不一样。学术类写作、英文写作还有翻译成了中国文字类AIGC产品的重点。众多产品都提供这种服务,比如火龙果写作、秘塔科技还有写作狐。
在2B领域,中国的初创公司选择了专攻垂直领域,而不是追究产品的通用性。一个典型的例子就是澜舟科技。在研发出了孟子大模型之后,澜舟科技并没有继续追求模型的通用性,而是专攻金融领域的NLP分析服务。
中国的AIGC的另一个独特之处就是在AI视频领域有着比较强的竞争力。特别是虚拟人和短视频方面,中国的公司更加懂得结合实用性和娱乐性,而西方的公司的产品往往只有实用性。
我们就拿中国的小冰和英国的Synthethia虚拟人公司来做个对比。Synthethia做出来的虚拟人跟普通公司白领无异,而小冰生成的万科虚拟员工崔筱盼却长着一副明星脸。
中国的虚拟人产业近几年逐渐人们的视野。不论是清华大学首位虚拟学生“华智冰”,还是冬奥会上谷爱凌的虚拟分身,每次虚拟人的亮相都能够引起舆论关注。比起专注于2B赛道的西方公司,中国的AIGC公司因为要做2C的业务,所以特别懂得吸睛引流。
咪咕的谷爱凌虚拟人分身在2022年冬奥会上首秀
虽然目这个产业的商业模式还不成熟,但是技术上一旦有了突破,中国公司的市场营销能力将成为其强大的国际竞争力。
但与此同时,中国在AIGC开发工具领域的初创公司甚少,比如在AI代码生成,还有零代码、少代码的工具领域基本上没有什么创业公司。这可能是因为开发工具领域语言、文化隔阂小、政策约束少,像GitHub这样的西方公司可以比较容易进入中国市场。而中国企业在B2B、B2D产品制作能力上的不足也让中国的开发工具产品很难和西方大厂竞争。
说了这么多,我们在最后想对中国的AIGC产业做出三大预测,供大家参考。
一是,中国会重点发展AIGC的底层技术,形成自主的模型和基础设施。近些年美国政府对华的一系列科技制裁,让国内的各大公司担忧自己哪一天会不会也成为美国的打击对象。想要维持AIGC领域的发展,中国的企业和学术研究院必须要投入更多的研发费用,投入到真正的核心技术研发上,形成独立的产业链。
二是,由于中国国内市场的局限性,出海是很多2B的AIGC企业的必然之选。在AIGC领域,已经有一些初创公司打造出了国际化的企业形象,进入了东南亚、欧洲、北美等海外市场。AI语音助手创业公司赛舵科技研发出了多语种的AI语音生成系统,涵盖了超过20种东南亚语言和方言。而高领资本和GGV投的AI模特公司ZMO.ai在中国成立,相继在美国和加拿大成立了办公室,打入北美市场。
ZMO.ai生成的AI模特
三是,政策监管和法律伦理问题将成为AIGC发展的一个重要挑战。去年12月,国家互联网办公室发布《互联网信息服务深度合成管理规定》,进一步规范AIGC产出的文字、图像和视频内容,规范了个人信息在深度合成中的应用。此前,不少AIGC公司都陷入了侵犯产权、个人信息和产出虚假内容的尴尬境地,包括OpenAI的代码生成软件Codex也因为抄袭GitHub开发者的代码而被告上法庭。如何能在发展技术的同时,遵守法律法规、伦理原则,成为AIGC企业面对的一大难题。
硅谷之外,中国的AIGC产业已经开始崛起。不论是从技术发展还是投资创业的角度来看,中国的AIGC产业相当活跃。中国的AIGC公司面临着和西方公司同样的挑战,比如寻找成熟的商业模式、发展下一代AIGC技术,还有遵循法规伦理。与此同时,中国的AIGC也要面对额外的压力,比如美国政策的打击还有技术层面的不足。
跟互联网和移动手机时代一样,中国的AIGC生态必定和西方不一样。当美国的AIGC公司重点发展B2B业务的同时,中国公司很有可能会首先进入电商、物流还有大消费市场,并且很有可能在国际市场上和西方企业一争高下。
中国的AIGC还处于萌芽期。未来,AIGC产业必将改变我们的生活,中国企业也一定能够加入这股浪潮。
注:本文作者为硅谷Leonis Capital风险投资基金Jenny Xiao (肖文泉) 和Jay Zhao
36氪
媒体专栏
阅读更多
金色早8点
金色财经
Odaily星球日报
欧科云链
Arcane Labs
深潮TechFlow
MarsBit
澎湃新闻
BTCStudy
链得得
文/金色财经0xnative最近两个月,全球科技圈最风头无两的产品一定非OpenAI和它旗下的产品ChatGPT莫属.
1900/1/1 0:00:00北京时间2月21日下午,被众多一线投研机构视为2023年以太坊最重要的创新,有可能开启以太坊新叙事方向的Eigenlayer终于披露了其V1版白皮书.
1900/1/1 0:00:00近年来,随着虚拟货币的迅速发展,全球各地区相继出台了不同的监管政策,郭律师团队为大家收集了相关新闻简讯,整理了“全球对虚拟货币的政策”系列文章,带大家了解全球各地区对虚拟货币的监管态度.
1900/1/1 0:00:00原文作者:Rekt Fencer做市商在 Crypto 行业有着特殊的地位,本文介绍了做市商的分类、运行策略以及如何分辨真实的交易等内容.
1900/1/1 0:00:00文:巴九灵你也在关注ChatGPT吧,无论是故意撩它,还是转发讨论相关的段子。显然,ChatGPT引发了近几年一次全球性的科技应用狂欢。两个月时间,月活用户突破1亿,成为史上用户增长最快的应用.
1900/1/1 0:00:00▌Coinbase CEO:Coinbase的质押服务不是证券,必要情况下愿意在法庭为其辩护2月13日消息,Coinbase首席执行官Brian Armstrong推特发文称.
1900/1/1 0:00:00