发布日期:2023-03-19 14:26浏览次数:
GPT-4惊艳亮相,国内厂商正面迎战,对标在所难免。获得百度文心一言和微软Bing内测资格后,文化产业评论(ID:whcypl)精心设计了关于国家文化数字化战略60问,全方位地考察AI的搜索、整合、研判能力和思维深度,同时也通过人机交互对国家文化数字化战略进行深注精解。文心一言与微软Bing之间真的有云泥之别?谁更懂国家文化数字化战略?结果,或许远超你的想象。
3月14日,Open AI宣布推出GPT-4,并称其为“最先进的系统,能生产更安全和更有用的回复”。
随后,微软宣布自家产品Bing(必应)已经接入了GPT-4,“确保用户拥有最全面的副驾驶功能”。
3月16日下午,百度围绕新一代大语言模型、生成式AI产品“文心一言”召开新闻发布会,并强调,虽然内测过程难称完美,但未来迭代能力和提升空间却十分可期。

多方入局,硝烟四起,比较、嘲讽、质疑在所难免。百度开放内测邀请,文心一言与GPT-4的正面较量也抬上日程。
有人关注百度股价的跌涨,有人热衷于找bug、寻笑料、编段子,有人就文学创作、商业文案创作、数理推算、中文理解、多模态生成五大应用场景进行对比……
在AI的秀场,玩法多样,值得探索的还有很多。文化产业评论(ID:whcypl)便决定别开生面地与文心一言和微软Bing来一场文化数字化的深度对话测试,围绕中办国办印发的设计了如下的60个问题,看看它们到底谁更懂国家文化数字化战略!
03、可以深入讲讲你对《关于推进实施国家文化数字化战略的意见》的理解吗?
13、文件中提到要“建设国家文化大数据体系全国中心”,你认为应该如何做?
20、李彦宏在百度文心一言发布会上说,“以后的应用会建立在大模型上,而不是建立在过去的云计算的这些算力或者存储上。”你认可他的说法吗?
25、你能给我介绍一下其他国家或地区的类似国家文化数字化战略的措施或项目吗?
29、但是文件中解释的是“推动文化机构将文化资源数据采集、加工、挖掘与数据服务纳入经常性工作,将凝结文化工作者智慧和知识的关联数据转化为可溯源、可量化、可交易的资产,分享文化素材,延展文化数据供应链”,什么叫做“经常性工作”?什么叫做“文化数据供应链”?
31、文化资源数据的标准、格式问题是一个很重要的问题,中国目前做了哪些努力呢?
32、你觉得这个标准体系起到作用了吗?具体应用效果如何?存在什么不足呢?
41、可以举一些国内外“利用现有公共文化设施,推进数字化文化体验”的例子吗?
42、那你觉得“美术馆、影剧院、新华书店、农家书屋”等公共文化设施要怎么改进,推进数字化文化体验呢?
45、“通过数字化手段促进城乡公共文化服务一体化发展”,具体有哪些手段和案例呢?
47、当前,图书、报刊、电影、广播电视、演艺等传统业态都面临着升级转型,你认为这些传统业态分别面临着哪些难题?
48、我对图书数字化很感兴趣,可以说说新型图书产品的案例吗?如果图书多媒体、互动化,那是不是跟广播剧、视频有关系了呢?图书的本质改变了吗?
49、你了解电影的线上发行吗?你觉得这会替代原有线、文件指出要“在文化数据采集、加工、交易、分发、呈现等领域,培育一批新型文化企业”,现在中国有哪些可称为新型文化企业呢?
51、你能举出具体的企业吗?它们都分别在哪一领域处于前沿,你现在所说的更像是案例。
52、就你看来,第十四届“全国文化企业30强”呈现了什么特点吗?比如领域集中度?企业属性?这反映出中国新型文化企业的什么问题?
53、为什么在这些企业中,比较少有充分展示“文化+科技”力量的数字文化企业呢?
56、你认为中国在“构建文化数字化治理体系”上,在哪些方面做得不错,在哪些方面需要加强?
57、推进实施国家文化数字化战略的主要目标是“中华文化全景呈现”,怎么解释?
59、中国将实现目标的时间设置在2035年,你觉得这十多年,文化数字化可能会给世界带来怎样的冲击与巨变?
60、就当下而言,你认为ChatGPT、文心一言等语言大模型的出现,是否会影响中国国家文化数字化建设进程?
上述问题包含了名词解释、搜索整理、对比思辨、理解阐释、主观评价、预测展望等多种问答类型,全方位地考察了AI的搜索、整合、研判能力和思维深度。由于问题数量较多,回答篇幅也较长,因此文化产业评论(ID:whcypl)在此选取一些了具有代表性、对比性和独特性的回答进行展示。


这一问题Bing与文心一言在整合回答上都没有太大问题,但Bing的回答相对来说更加切中要点。这里我们也发现文心一言回答中出现了“传播播体系系”这样的bug,似乎在意料之中。


这一题有关政策搜索。Bing就询问的内容给了两个相关答案,而文心一言就一个政策进行了内容阐释。总体来说,Bing的回答更符合题中要求。


这是一个理解阐释型的问题,有关文化数字化战略八大任务之间的内在关系。从回答上来说,两个都答到了相辅相成的核心要点,但显然Bing的回答更能揭示几者之间的内在联系,而文心一言的回答是较为笼统的。


这一题还是一道搜索型的题目。而这次文心一言的回答明显更胜一筹,针对题目中所说的文化专题数据库,竟然给出了8条相关信息,而且看起来也恰有其事。但缺点也很明显,Bing给出的信息均有索引,而文心一言给出的条目却无法索引,难以判断是真实存在还是胡编乱造。


这一题承接上文,询问的是数据库关联和部署原则,从答案上说,Bing的回答更多围绕着政策展开,文心一言的回答则更发散,阐释的内容也更多。不过总体而言,可以说都不专业,并没有真的提现出目前在推进的措施。


关于建设国家文化大数据体系全国中心的先决条件,虽然都是表面的内容(甚至片汤话),但Bing与文心一言的回答侧重点不同。Bing侧重于数据展开,而文心一言则是面面俱到式的回答。在下一题“你认为目前哪些条件已经具备,哪些还需要加强?”中,文心一言再次重复了这套论述,Bing则给出了新的答案。这也显示出两者对于关键词抓取和理解还存在一定的差距。

20、李彦宏在百度文心一言发布会上说,“以后的应用会建立在大模型上,而不是建立在过去的云计算的这些算力或者存储上。”你认可他的说法吗?

这一题涉及到主观评述,Bing的回答相当地精简和适宜,而文心一言虽然稍有啰嗦,但也展现了较强的理解输出能力。


这一题最重要的是对“阶段”这一词的理解,Bing的问题相对更准确,而文心一言则回到了说囫囵话,泛泛而谈的状态。不过,Bing在回答中所引的《关于加快推进广播电视网络融合发展促进5G时代信息消费扩容增效的指导意见》并不存在,这也是GPT始终存在的糅合信息,说瞎线、你能给我介绍一下其他国家或地区的类似国家文化数字化战略的措施或项目吗?


29、文件中解释的是“推动文化机构将文化资源数据采集、加工、挖掘与数据服务纳入经常性工作,将凝结文化工作者智慧和知识的关联数据转化为可溯源、可量化、可交易的资产,分享文化素材,延展文化数据供应链”,什么叫做“经常性工作”?什么叫做“文化数据供应链”?


31、文化资源数据的标准、格式问题是一个很重要的问题,中国目前做了哪些努力呢?
47、当前,图书、报刊、电影、广播电视、演艺等传统业态都面临着升级转型,你认为这些传统业态分别面临着哪些难题?


48、我对图书数字化很感兴趣,可以说说新型图书产品的案例吗?如果图书多媒体、互动化,那是不是跟广播剧、视频有关系了呢?图书的本质改变了吗?


57 推进实施国家文化数字化战略的主要目标是“中华文化全景呈现”,怎么解释?
59、中国将实现目标的时间设置在2035年,你觉得这十多年,文化数字化可能会给世界带来怎样的冲击与巨变?


60、就当下而言,你认为chatgpt、文心一言等语言大模型的出现,是否会影响中国国家文化数字化建设进程?
有趣的是,内测开放后,一夜之间,外界的态度就开始分化。不少试用者说“远超预期”,资本市场也给出了正向反馈,百度股价开始回升。
从文化数字化战略60问的测试中也不难看出,文心一言与GPT-4之间,虽然存在不小的差距,但并没有云泥之别,天悬地殊。从关键词的抓住、理解,灵活表达而言,微软Bing无疑是更具优势,在应对多个问题时也能做到条理清晰。但文心一言在搜索整合信息时,明显更有中文语料的优势,可以获取到多段信息,很多阐述也相对完整。从缺点来说,微软Bing最大的问题是可能会提供较多虚假信息,造成信息污染,而文心一言的缺点则是对问题还缺乏全面的理解,会漏掉要点,表达时也经常泛化冗长,信息凝聚力不强。
但正如李彦宏所说,“大语言模型这种产品一旦发布出来,就会获得真实的用户反馈,有了用户的反馈,它的迭代速度、能力提升就会非常快。”作为中国首个AI大语言模型,文心一言既是百度未来战略中的重磅武器,也是承载中国科技荣光的智能产品,面对真实的应用场景和强大的对标对手,它当然还有很长的路要走。但是,只要在向前奔行,就不会沉睡无声。开云体育 开云官网开云体育 开云官网开云体育 开云官网