您的位置:首页 >首页栏目 > 媒介 >

北京大数据协会理事张广志:严肃领域需要可解释、可通用的大模型

自ChatGPT爆火之后,对话式大模型迎来爆发式增长,国内外的诸多公司纷纷推出不同款的对话式AI大模型,是否有可能同时和多个对话式AI大模型进行对话呢?


(资料图片)

以此为切入点,曾任哈工大计算机学院副教授的孙志岗等人一起开发了一款名为ChatAll(中文名:齐叨)的开源人工智能大模型工具。作为ChatAll中文名命名人,北京大数据协会理事、北京融信数联科技有限公司CTO张广志表示,ChatAll已经在全球最火的技术开源平台Github上线,技术人员均可以在平台上免费使用ChatAll。

张广志说,ChatAll之所叫作齐叨,意思是对于用户所提出的问题,让“大家”一齐叨叨,起到一呼百应的作用,而这里的“大家”意思是目前主流的10多款大模型工具,诸如ChatGPT、文心一言等。

ChatGPT引发了对话式AI大模型的爆火,却没有一个对话式大模型能保证输出的内容百分百靠谱。使用过对话式AI大模型的用户都有一个感受,有些时候对话式大模型AI给出的内容真假难辨。

张广志表示:“现在的很多大模型就是不可解释,但是在很多严肃领域要求大模型可解释,因为只有可解释的背后才能涉及到责任的承担。”

ChatAll让大模型一起赛马

“目前国内外知名的人工智能大模型均已接入ChatAll,这意味着用户只需要提一个问题,这些大模型就会一起根据自身优势和所长进行回复,ChatAll主要是起到了一个聚合的作用,省去了用户在各种平台间来回折腾的烦恼。当然,用户可以根据自身的需要或偏好,选择关闭或开启任何一个或几个、全部进行聊天。”张广志说道。

目前国内外推出的对话式AI大模型各有优缺点,张广志表示,在做ChatAll时有一个最朴素的想法——既然一个大模型不能保证百分百的准确,那就集成多个大模型让它们去赛马,让大模型同时去聊,用户再自行判断是否要相信哪个大模型。

“这其实类似于投票,可以叫作集成可信的大模型框架。ChatAll没有本质的技术创新,只是模式上的创新。”张广志表示,“从提出这个想法到正式发布ChatAll,前后用了很短的时间,因为大部分的代码都是用GPT-4来完成,少部分是人工修改或原创。”

但张广志认为,做ChatAll首先的难点还是模式创新,就像阿里巴巴最厉害的地方并不在于技术,而在于打造了线上担保交易的模式,ChatAll的模式创新就是在大模型领域打造了一套集成可信的模式。当然第二个难点还是技术,将国内外的大模型集成到ChatAll当中需要做很多的适配工作,包括安全机制问题、接口问题等等,只有尽量克服用户在使用时的障碍,才能让用户最方便地使用ChatAll。

需要注意的是,ChatAll只是集成好了众多对话式AI大模型的框架,方便用户同时开启多个对话式AI大模型。但用户需要先拥有各个不同大模型的账号,才能在ChatAll中“激活”相应的大模型进行使用。

在最新版本的ChatAll增加了支持保留历史聊天记录的功能,针对的是现在不少对话式AI大模型不能保留历史聊天记录的功能。未来ChatAll可能还会增加自主判断和归类功能,比如问了7个大模型,ChatAll可以判断其中4个大模型是类似的回答,而另外3个大模型是另外一类的相似答案。

“ChatAll未来还有很多工作可以做。”但张广志表示,参与到ChatAll的开发人员,都是以个人身份参与其中,大家希望一起做这样一个开源项目推动行业的发展。

可解释的大模型

这一波大模型的发展中,可以说是ChatGPT开启了大模型百花齐放的时代。

ChatGPT本身是一个大模型,爆火的背后是因为在方向选择上,ChatGPT选择了一个并不严肃的领域——聊天,这是一个用户使用门槛低,且容易上手和传播的方向。

“大模型本质上也是沿着各种人工智能的算法和模型在发展,但由于如今算力、模型和数据质量的大幅提升,大模型打通了‘任督二脉’,从量变达到质变。”张广志表示,在一些领域对话式AI大模型已经有很惊艳的表现。尤其是和搜索相比,大模型在对话中可以更准确地掌握用户的意图,这使得对话式AI大模型在知识类、常识类领域的问答中有较明显的优势;以及在约定俗成的常规化工作领域,比如书写会议纪要、申请书等大模型是一个好用的效率工具,另外在跨语言的翻译中,大模型的表现也非常出色。

张广志表示:“目前,很多人是凭着个人经验和能力在探索性地使用大模型,但对话式AI大模型还没有真正实现产业化应用,也没有形成主流的行业。”而且,对话式AI大模型也有不靠谱的时候,人们并不敢相信某一个大模型,因此张广志认为,以ChatAll为代表的集成可信的大模型框架是大模型发展的第二阶段。

加上基于大数据和深度学习算法的大模型本质上是一个黑盒,具有不可解释性,对于大模型在一些领域的商业化应用存在一定隐患。怎么理解黑盒呢?张广志举例说道,比如,我们控制一盏灯,如果它只有开关两种状态,用一个开关就可以控制,用电路的通和断就能很好地解释它是开还是关。大模型时代,它可以随意控制灯的色温、亮度等,但如果这背后有100万个开关来控制,通过100万个开关的参数组合来控制灯的各种表现,就很难解释100万个开关具体是怎么组合的。如果这个数据不是100万个,而是几亿个开关同时控制,就更加难以解释。

张广志认为,大模型发展的第三个阶段应该是可解释可通用的大模型,尤其在很多严肃领域。

“如果说不可解释的大模型,当它胡说八道时,责任谁来承担,换句话说也没有安全性。”张广志说道,首先安全性无法保障,其次无法在严肃领域做到可解释的大模型,在实际推广应用的时候就会面临各种障碍。

张广志所在的北京融信数联科技有限公司这几年一直在给政府提供大模型服务,其中北京融信从2018年开始打造的“智能图谱”就属于一种可解释可通用的大模型,虽然不像普通人就可以使用ChatGPT,并且会觉得对话式大模型很好玩,但智能图谱在一些严肃领域已经能够提供较好的技术支撑。

“我们在和政府部门合作时就被要求,必须是可解释可通用的大模型,不能只是输出一个结果。”张广志说道。

大模型正在改变世界

以大模型为代表的人工智能正在改变世界,似乎已经是一个不争的事实,而对于其过于“智能”,甚至恐将挣脱于人类的监管的担忧也甚嚣尘上。人工智能全面来临的前夕,我们应该抱持怎么样的态度?

“我觉得大模型发展到了现在,相当于以前我们发现了煤炭和石油,甚至又发现它们还能帮助我们取暖,进而由它们为基础制造出蒸汽机、电等形成了工业文明。可以说,到目前为止,大模型的发展不亚于电的发明,是一种划时代的科技演进。”张广志说,现在大模型行业还是处于百花齐放的状态,但不久的将来可能会出现整合,合久必分,分久必合,是一种变化常态。

张广志表示,大家所担心的安全问题,主要是针对科技伦理角度而言,但很多大模型应用已经是经过了大量人工干预的结果,比如人工标注、人工筛检、人工屏蔽,如果人工不介入,大模型基本是没办法使用的。

“如果不是大量的人工干预,大模型一定到处充斥着色情、暴力和教唆等内容,因为这些东西通常是人性的弱点。尤其是当用户在不断使用这类大模型过程中,又在不断地训练它,大模型则会不断地强化这类内容学习和输出。”张广志说,现在很多人在担心人工智能将来可能会脱离管控,因为它会变得越来越智能,这会导致它会自主地绕过人类的监管。

“目前只能依靠大量的人工去做标注,例如通过筛检、屏蔽、拉黑等方式切断大模型学习一些不良信息的路径。我们可以将大模型的学习理解为一个小孩的成长过程,从这个孩子的诞生到长大,家长需要告诉他应该怎么样、不应该怎么样,当他犯错了还要对其进行批评教育甚至惩罚。”张广志说。

那么,以大模型为代表的人工智能还要不要继续搞?“要搞,但要安全地搞。”张广志肯定地回答道,首先要大力发展人工智能优化管理的技术,其次是立法机构要对此进行立法。“在未来,不可能一直靠大量的人工去干预。”

“从法律层面来说,我们怎么定义人工智能;它具备什么样的法律地位;它背后的责任人或者法律主体是谁;一旦发生纠纷,承担法律责任的是用户还是开发公司?这些都需要法律去定义。如果再超前一些,法律还有可能将其定义为除自然人、法人之外的第三类法律主体。”张广志说。

关于大模型的畅想

张广志表示,从个人和公司层面而言,可以通过各类大模型来完善和丰富自己的能力,提升工作效率。而从我们国家层面来看,人工智能时代更是一个巨大的机会。“因为我国人口众多,应用场景丰富,而且工业基础和生产制造能力十分强大。”

但也有不少人担心人工智能会替代人,让很多人失业的问题。事实上,这也是正在逐渐发生的,但这只是看到了问题的一方面。百度创始人李彦宏曾对此表示,很多人担心人工智能会让工作机会减少,是因为他们能够看到现在的工作会消失,但是他们看不到新的工作机会会被创造出来。就像100年前、200年前那些人,看不到后来产生的新的工作机会一样。虽然看不到未来有哪些新的工作机会,但李彦宏并不担心大模型会导致人类工作机会减少、生活会变差。

张广志亦认同上述观点。他认为,当前我们的人口生育率下降所带来的影响,可以考虑通过人工智能来进行弥补。事实上,我们有许多工作是枯燥的和重复性的,而这类枯燥的应用场景完全可以由各类人工智能机器人来替代,更多人可以按照自己的意愿去从事服务性、创造性、历史性等更强或更有价值的工作。“按照自己的意愿去发展,正是我们一直所追求的实现人全面而自由发展的目标。”

张广志认为,对于政府层面而言,未来以各类大模型为代表的人工智能也会与之深度结合,这会大大提高效率和节省人力。他举例称,如果一个人要注册公司,他只需要在政府的官网或者其他政府设备上提出这个需要,大模型可以根据这个人的大数据迅速给出几个选项,他只需要点击他想要的选择即可。例如这个人是山东人,但工作在北京,大模型完全可以根据他的个人大数据判断出他想要把公司注册在何地,给出北京、山东等几个选项,也可以根据数据,判断出他长期以来所从事的职业,给出几个选项,例如注册公司的类型是科技公司还是文化传媒公司等等,这个人只需要选择他想要的就可以。然后政府的大模型可以进行审批,直接线上办理。

“而到那时,政府的工作人员可以集中精力去做更有益的事,例如处置突发事件、谋划重大战略等。”张广志说,“未来可能还会有相当一部分公务人员去从事管理这些大模型的工作,要去教育、监督、惩罚各类大模型,让大模型更好地服务于人。”

张广志表示,事实上大模型已经介入了政务工作,例如我们为各级政府所开发的融信宝等产品,你只需要输入公司名称,他就会迅速推送与之契合的各类政府政策,避免企业为了政策而“大海捞针”。“今年就可能会出现各种基于自身不同优势的各类大模型应用,例如有的偏向于政务,有的偏向于聊天,有的偏向于法律咨询等等。其实我们现在接到的很多推销或者客服电话,对面已经是人工智能机器人了。”

李彦宏亦认为,在未来,所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型。大模型会深度融合到实体经济当中去,赋能千行百业,助力中国经济开创下一个黄金三十年。

“我们应该抱持积极的态度,这对任何人而言,以大模型为代表的人工智能对我们来说都是一次绝佳的‘升级’机会。”张广志说。

标签:

精彩新闻