隋唐演义

隋唐演义

自动驾驶怎么解决两难问题 极狐阿尔法s自动驾驶可以上路吗

双十一 0

手机淘宝搜:天降红包55 5月20日开始,每天领红包。
京示搜:天降红包369,5月28日开始

自动驾驶困难,自动驾驶难点知乎,自动驾驶路线之争,自动驾驶解决方案

本文来源:品驾

/ 导读 /

比亚迪的战争又打响了。

2月10日,比亚迪秦PLUS DM-i2023冠军版正式上市,新车虽然改动不大,但起步价已至99800元,DM-i车型价格首次下探到10万以下这个区间。

这场战争有那么可怕吗?有人还真怕。

以前,如果说只以省油为目的,那么并不推荐你买一辆混动、特别是插混车型。因为混动车型在价格上,要比同级别的纯燃油车贵几万块。对于一般家用来说,几万块钱的差价够加更多的油。特别是轩逸、卡罗拉和雷凌这类紧凑型轿车,本来油耗就不高,购车者想要从实惠出发,买燃油版更合适。

但现在,比亚迪越了两级开始跟合资燃油车打。用插混的车,直接越过混动的价格,去跟燃油车直接竞争。

要说谁最慌,那必然是合资燃油车,尤其是这最走量的“日系三杰”。

合资燃油车的好日子,快到头了。

从比亚迪秦这款车来看,比亚迪的目标很明确。就是要照着最爆款的几款车来打。

2022年,据乘联会发布的数据显示,全年轿车销量排名前三位的车型分别是轩逸、宏光MINI EV与新朗逸,比亚迪秦位居第四。抛开宏光MINI EV这个特殊的存在,不仅是前面的轩逸和朗逸,榜单中10万级的紧凑型轿车,都无法忽视比亚迪带来的影响。就像它的名字一样,“冠军版”就是为了拿下各种冠军,“秦”就是为了第一个一统天下。而它今年的任务,第一个就是“干掉”这些合资燃油对手。

合资品牌也没有魄力敢和比亚迪打价格战,原因很简单,比亚迪创始人在位,更着眼长期利益,短期利益即便没那么好看,也担得起这个责任。合资品牌都是职业经理人模式,敢用任期成绩去赌吗?

长期以来,不少合资品牌都过的太舒服了。就说日系这三家,为什么它们的插混卖那么贵?说白了,其实还是舍不得燃油车的利润。因为它们必须拉开燃油与新能源产品间的价格差距,避免自家产品“互相打架”影响销量,舍不得给燃油降价,那就只能给新能源定高价。

从榜单也能看出,就靠卖这些燃油车,这几家合资品牌也还能过得不错。不过现实终于也来了,既然你自己不做改变,那么一定会有人“帮你”改变。日系在电动化上的落后,根源就在于他们上一个时代很成功,无论是燃油车还是HEV,他们都有优秀的产品和不错的销量。任何时代终究有结束的一天,比亚迪已经出牌了,手中无牌的合资品牌,这一波注定接不住。

- End -

/ 导读 /

近日,美国国家公路交通安全管理局(NHTSA)宣布,其将召回近37万辆已安装或待安装全自动驾驶测试版(FSD Beta)的汽车。其实早在今年1月份的时候,NHTSA就要求特斯拉提交召回申请。而特斯拉在尝试与NHTSA的多次沟通无果后,最终自愿召回。

这次召回包括2016-2023 年的Tesla Model S、 2016-2023年的 Tesla Model X、2017-2023年的 Tesla Model 3以及2020-2023年的 Tesla Model Y 。据《洛杉矶时报》报道,这次受影响的需要召回的汽车数量约占特斯拉全球已售汽车总数的10%,对特斯拉的影响之大不言而喻。

召回的原因是什么?

这次召回的主要矛盾聚焦在特斯拉的亮点配置――FSD。去年11月,特斯拉FSD Beta面向北美付费用户开放。成为FSD和特斯拉一个具有里程碑意义的事件。而如今只隔了三个月时间,矛盾就已经上升到了NHTSA的层面,并直接触发了召回,背后的原因还是值得探讨。

在NHTSA公布的报告中,从2019年5月8日至2022年9月12日,特斯拉自己就已经确认了18起可能与此类问题有关的事故。NHTSA认为,FSD可能会允许车辆在十字路口做出不安全的行为,有撞车的风险。例如,在黄色交通灯期间行驶,或转弯通过某些十字路口,以及在某些只能转弯的车道改变车道以继续直行。此外,FSD Beta会对指示牌上的速度限制变化反应较慢,以及无法理解到驾驶员希望改变车辆速度的意图,有可能会按照和驾驶员意图相反的行进速度前进。

是不是召回?

对于FSD 目前存在的缺陷,特斯拉并不否认。特斯拉预计将在4月15日之前以OTA升级的方式为客户免费更新FSD Beta,来解决NHTSA提出的顾虑。

但马斯克对于“召回”这个词却有不小的异议,这也是为什么特斯拉和NHTSA就召回反复拉锯。在马斯克看来,这次的安全缺陷可以通过OTA的方式对软件升级来修复,理论上并不需要像更换硬件一样对车辆进行召回,所以这不是严格意义上的召回。当前,正是FSD Beta版在全球推广的关键时刻,如果贸然使用“召回”这样的词汇,会影响到消费者对最新的FSD Beta的信心。而事实也正如马斯克预计的那样,在公布了大规模召回的信息后,特斯拉股价迎来大跌,当日收盘下跌5.7%,每股报收202.04美元。从1月份官宣降价以来,特斯拉的股价快速上升的势头有可能戛然而止。

其实美国NHTSA的做法并没有错。国内的监管机构,对于车企采用OTA做法来修补整车缺陷的做法,也制定了相应的规定,即需要正式向公众进行备案。在软件占整车比重愈来愈大的情况下,OTA这样的技术手段可以让整车企业在软件存在缺陷的情况下就向市场推出产品。对于消费者来说,这中间存在比较大的安全隐患。因此让修补缺陷的OTA备案,视同召回,本身也是对企业的一种约束。在这方面,马斯克和特斯拉有点想当然了。

自动驾驶离我们依然非常遥远

对于特斯拉以及其FSD付费用户来说,FSD Beta版依然是一套驾驶辅助软件,其命名和其实际可以使用的功能依然存在明显的差异。驾驶员在开启FSD后,依然需要对车辆和周边情况进行监管,并根据需要对车辆的制动、转向以及加速进行接管操作,以确保车辆的行车安全。所以说,即便是特斯拉的用户支付了高达1.5万美元购买的FSD,依然离开真正的我们理解中的自动驾驶其实还有很长一段路要走。

在FSD自动驾驶功能方面,特斯拉或者说马斯克本人也是过于乐观。自动驾驶长尾工况的存在,使得其短期内难以真正落地商业化部署。即便特斯拉开发出了高算力芯片,同时在路上开的特斯拉的车型也正在源源不断在为特斯拉收集真实的道路场景数据,叠加上特斯拉还自己打造了超算中心,大大提升了算法优化的效率,但这些都未能让FSD Beta版真正实现L4级别的自动驾驶。L4级别自动驾驶技术在全场景下的部署还是存在非常多的限制,无论特斯拉在AI方面相比于传统车企存在多大的领先优势,要想和竞争对手们拉开足够的差距率先实现L4级别自动驾驶技术落地有太多太多的问题有待解决。也许在未来的某一天,特斯拉可能会推倒现有的方法论,另起炉灶重头再来。

按照原本的计划,FSD Beta版今年还会在欧洲市场进行测试。但目前来看,能否如期成行,还存在一定的不确定性。而与此同时,奔驰的Dri【【微信】】已经在德国上线。在德国的高速公路上,当驾驶员开启Dri【【微信】】之后,且整车车速在60km/h以下,驾驶员可以看书、喝咖啡或者从事其他娱乐或者工作。一旦出现交通事故,奔驰将承担所有的赔偿责任。在某种程度上,在特定场景下实现L3的奔驰Dri【【微信】】比FSD Beta版更加先进一些。虽然前者在不限速的德国高速公路上基本没有太大的实际使用价值。

通过对于现有的驾驶辅助系统持续优化来持续解锁更多的场景来趋近L4,应该是包括特斯拉在内的所有车企和自动驾驶技术公司目前会采用的主要策略。不过NHTSA这次的判例,有可能会让特斯拉以及其他车企在美国自动驾驶相关的召回数量急剧增加。因为解锁新的场景和对过往的软件中的bug进行修复之间如何进行区别,还缺少明显的标准。对于主机厂来说,未来宁可放慢推出自动驾驶/驾驶辅助软件推出的速度,也要在推出前更加精细地进行打磨。

最近,特斯拉在网络媒体上又有刹车失灵的事件爆出。和这次的FSD召回联系在一起,我们希望特斯拉在处理相关问题上能够更多站在客户角度上来思考。冷冰冰的回应和数据并不能解决所有问题,能够更加耐心地解决客户诉求,并承担自身技术上存在的缺陷所导致交通事故的责任,才是最好的解决问题的方法。

- End -

/ 导读 /

在自动驾驶技术发展如此迅速的今天,很多量产车上已经配备了多种的辅助驾驶功能,例如自适应巡航ACC、紧急制动AEB、车道居中保持LKA等等,很多的车主也都体验到了技术带给驾驶的改变。另一方面,由于现在的自动驾驶技术还处于发展阶段,无法保证自动驾驶车在任何天气条件下和任何道路环境中都可以安全行驶的。因此,要根据该系统的能力来提前设定好ODD,通过限制行驶环境和行驶方法,将有可能发生的事故防范于未然。

什么是运营设计域ODD?

首先,我们需要了解何为ODD设计?运营设计域ODD(Operational Design Domain)一词的原始定义来自SAE J3016中,描述为:

特定驾驶自动化系统或其功能专门设计的运行条件,包括但不限于环境、地理和时间限制,和/或某些交通或道路特征的存在或缺失。

简单来说,ODD就是要定义好在哪些工况下是能够自动驾驶的,脱离了这些工况,自动驾驶就不能保证工作。任何一台自动驾驶车辆,都必须有一定限定的工况。而这个工况可以很宽泛,也可以很精准,并决定了自动驾驶车辆能胜任什么样的场景。比如,一台车的自动驾驶系统只能在高速上使用,它可以自动保持车道、自动超车、自动跟车、自动让行、自动通过ETC、自动上下匝道等,但到了城市里就无法完全自动驾驶。同时,要确保自动驾驶测试和验证是完整的,至少需要确保ODD所有方面已经通过确保系统安全运行,或通过确保系统能够识别超出ODD 的范围。

因此,自动驾驶系统在启动时需要判断当前所处的环境,如是否黑夜,天气状况等等,从而判断能否启动该自动驾驶功能。在运行时需要识别是否超出该ODD,从而判断该自动驾驶系统能否安全运行。同时,在定义自动驾驶系统的设计运行条件时,需要明确自动驾驶系统能够安全启动和运行的外部环境条件。

ODD的分类框架

那么,如何对自动驾驶领域的ODD进行设计与分类呢?这方面,NHTSA给出了很好的分类标准,在《A Framework for Automated Dri【【微信】】ses and Scenarios》中采用六大要素构建设计运行域,分为基础设施Physical Infrastructure、驾驶操作限制Operational Constraints、周边物体Objects、互联Connectivity、环境条件【【微信】】ons和区域Zones。

通过对于这六大要素的划分,可以较为清晰地定义出自动驾驶系统可以运行的工况及范围。

在国内,由中国智能网联汽车产业创新联盟预期功能安全工作组发起,清华大学与国汽(北京)智能网联汽车研究院有限公司牵头编制的《智能网联汽车预期功能安全场景库建设报告》,也为自动驾驶ODD的设计提供了很好的参考。

其中,对智能驾驶现有感知技术、定位技术、决策方法、控制方法、人机交互、通信技术等进行了调研与局限性分析,得出对应的智能驾驶预期功能安全测试需求;并基于以上测试需求,设计了面向智能驾驶预期功能安全测试的“7层架构”格式的虚拟场景框架。

在该框架中,综合考虑了现有智能驾驶系统设备功能局限、算法缺陷以及人员误用等问题,并参考Pegasus项目,覆盖了传统智能网联汽车道路、交通设施、道路和设施临时改变、交通参与者、气候环境、通信信息这六层结构,为适应预期功能安全场景测试需求,在已有基础上增加了智慧交通设备,如路侧传感器、路侧通信设备、路侧信息处理单元等元素,更加清晰定义了场景分类时的参考标准。

ODD的边界如何测试?

既然ODD的划分标准与框架都有相关的标准可以清晰定义,那么在对ODD场景进行分类之后,如何去测试这些ODD的边界来判断现有的自动驾驶系统是否合格达标呢?

我们知道,自动驾驶汽车的开发满足V字开发模型,在V字开发模型中,涉及的测试方法主要包括软件在环(SIL,即software-in-loop)、硬件在环(HIL,即hardware-in-loop)、车辆在环(VIL,即【【微信】】),再到最后的整车场地、道路测试等方法,涵盖了从零部件到系统再到整车的全链条验证。在测试内容方面,主要包括传感器、执行器、算法、人机界面测试以及整车功能等内容。

首先是在环测试,借助虚拟现实数据生成、传输与交互技术,模拟自动驾驶汽车在真实道路环境行驶,并通过概率分布的危险场景强化模拟方法,进行的自适应加速测试。通过在环测试,可以在大幅节约测试时间和成本的同时,给虚拟测试提供了验证结果,并为实际道路测试提供了较为真实的参考数据。

其次是场地测试,结合工业和信息化部、公安部、交通运输部等三部委共同发布的《智能网联汽车道路测试管理规范(试行)》,“考试项目”设置可以包含以下几个方面:一是基本交通管理设施检测与响应能力测试;二是前方车道内动静态目标(机动车、非机动车、行人、障碍物等)识别与响应能力测试;三是遵守规则行车能力测试,测试内容应包含超车、并道、通过交叉口等内容;四是安全接管与应急制动能力测试,测试内容应包含靠边停车与起步、应急车道内停车、人工接管等内容;五是综合能力测试,综合考察自动驾驶汽车对交通语言认知能力、安全文明驾驶能力、复杂环境通行能力、多参与对象协同行驶能力、网联通讯能力等内容。

通过合理设计及严格执行的测试流程,才能保证自动驾驶ODD的边界准确性,为自动驾驶在实际使用的过程中安全做出保障。

总结

总的来说,ODD的场景分类给予非L5级别的自动驾驶非常明确的场景定义以及测试标准,可以极大程度上保障驾驶员在使用这些自动驾驶功能时的安全性,而根据不同场景的业务需求进行合理地ODD设计以及测试已经成为了所有自动驾驶企业们着重关注的目标。在未来,随着自动驾驶技术的不断普及以及量产,对于安全性的关注将越来越高,保障自动驾驶功能在ODD范围内的稳定运行成为了所有车企们的共同研究课题。

- End -

/导读/

套用股评文章创作模式,近期自动驾驶卡车行业完全如笔者前几天所精确预言的,低开低走,破位下行,Locomation即将退出。

2023年2月23日消息,位于美国匹兹堡地区的自动驾驶卡车初创公司Locomation即将于本月底关闭。如果成为现实,这将是宾夕法尼亚州匹兹堡地区继鼎鼎大名的Argo AI于2022年10月突然关闭之后的4个月内关闭的第二家自动驾驶汽车公司,此后匹兹堡仅存的自动驾驶公司只剩下Aurora公司一家。

匹兹堡地区的几家媒体报道称Locomation公司已解雇了大部分非工程人员,面临关闭窘境。

据《匹兹堡邮报》报道,Locomation未能筹集到额外的投资资本,导致裁员。自2018年成立以来,该公司已筹集1.05亿美元,其中包括最近2022年10月的1500万美元。

Locomation公司否认了媒体关于关闭的报道,但承认确实解雇了大部分非工程人员。目前尚不清楚Locomation估计的122名员工中有多少人面临解雇,有消息估计有80名员工,其中大部分于2月24日离职。Locomation拒绝提供细节信息。Locomation公司联合创始人兼首席执行官?etin Meri?li表示“我们不会关闭(We are not shutting down)”。“面对经济逆风,我们确实减少了大部分非工程人员(We did reduce most of our non-engineering headcount in the face of economic headwinds.)。

对于公司的发展情况,Locomation政策和战略副总裁Finch Fulton表示, “很明显,我们非常失望;我们确实觉得我们已经做好了所有正确的工作”。“我们有非常聪明的人和非常具有战略意义的方法……我们在产品市场上有客户,但由于一些宏观经济原因,我们无法筹集资金来继续运营,也无法进一步发展,以使产品能够投入商业运营。”

Locomation源于*梅隆大学(Carnegie Mellon Uni【【微信】】)的国家机器人工程中心,由五位联合创始人于2018年创立。Locomation正在开发重型卡车的编队行驶技术- ARC自动驾驶编队行驶系统(Autonomous Relay Convoy)。该技术将允许有安全驾驶员的领航卡车引领第二辆卡车,第二辆车中的驾驶员可休息或做其他工作。

当ARC系统启用时,只有领头驾驶员主动参与驾驶。随行卡车则由ACR系统控制,使用专用近距离通信(DSRC)技术互相连接,其驾驶员会可以交出车辆控制权,此时,跟随行卡车达到L4自动驾驶级别。ARC系统使一名驾驶员能够驾驶配备了技术增强的领航卡车,而跟随卡车则通过Locomation的完全自动驾驶系统进行跟随操作,这允许跟随驾驶员在卡车行驶时退出工作记录并进行休息。

Locomation表示最终目标是将司机从卡车上移除。

Locomation 第三代测试车辆

该公司此前吸引了货运商的极大兴趣。通过在允许的11小时轮班结束时更换司机,Locomation可以每天安全驾驶两辆卡车长达22小时,同时遵守服务时间法规规定。

Boundless Impact Research&Analytics2021的一项评估得出结论,与传统的8级卡车相比,配备Locomation技术的卡车将

  • 将货运的温室气体足迹减少22%;

  • 降低运营成本19%;

  • 降低燃料消耗21%。

LOCOMATION的两车编队在匹兹堡街道上行驶

Locomation此前与Wilson Logistics、PGT Trucking和Christenson Transportation合作,对其概念进行实际测试和开发。2022年8月,Ste【【微信】】达成了一项为期8年的协议,将在未来5年内使用Locomation的自动中继车队(autonomous relay convoys)在特定的州际车道段运营多达500辆卡车,相关财务条款未披露。

就在两周前,Locomation还在其YouTube频道上发布了一段视频,演示了自动编队行驶车队如何成功地从宾夕法尼亚州匹兹堡往返宾夕法尼亚州伊利市行驶近200英里,仅使用了一名主动驾驶员和一名安全驾驶员。

ISO 2022年9月发布卡车编队行驶标准ISO 4272:2022-智能交通系统-TPS卡车编队行驶系统(Truck platooning systems)功能和操作要求(Intelligent transport systems ― Truck platooning systems (TPS) ― Functional and operational re【【微信】】)。

欧洲ENSEMBLE项目近期已结束,定义了两种编队行驶功能:作为支持功能的编队行驶(PSF:Platooning as Support Function)和作为自动驾驶功能(PAF:Platooning as Autonomous Function)的编队行驶。Locaomation的ARC技术与ENSEMBLE项目定义的PSF编队行驶功能类似,是最有希望近期实现应用的中间技术路线。

日本由国家推动测试项目并取得一定成果,后续有明确推进计划,但目前技术水平离应用还有较大差距。

上汽红岩与友道智途携手打造的“5G+L4”智能重卡,在上海连接浙江的东海大桥高速场景下实现重大突破,其队列跟驰“减员化”运营测试项目已顺利完成5车编组、中间3车“真无人”的技术验证落地,并将启动全国首例社会道路常态化“真无人”测试和运营,标志着我国自动驾驶产业“无人化”运营迎来了里程碑式节点。

其他各卡车企业除了初期的Demo之外,没有宣布的重大进展。

总结

综上,笔者认为:

  • 顺风时猪也能飞起,逆风时大雁也得趴下。

  • 自动驾驶面临的困境,不是资本问题,是技术进展程度不满足预期的问题,归根结底是技术成熟度不够的条件下,都想抓住风口。

  • 现在要看下一家是谁先挺不住了,或者风先来?

此外,乘


gpt经典问题 文心一言gpt4

gpt got,gpt gho,gpt.ini,gpt-n

观点 / 刘润 主笔 / 尤安 责编 / 李桑

这是刘润公众号的第1841篇原创文章

昨天,一觉起来,美国的OpenAI正式官宣了大模型GPT-4 。

距离上次基于GPT-3.5的ChatGPT的推出,才刚刚过去105天。

科技进步的速度和力度,再一次让人震撼。

好像刚感叹完GPT-3.5通过谷歌程序员面试,GPT-4就已经把美国的模拟律师资格考试都考到前10%了。

转战到考场,也能把美国高考题(SAT考试),做出可以进哈佛的成绩。

甚至,还展现出了识图方面的巨大潜力。

我们总认为,不着急,还有很多AI做不到。

但是,AI一项一项,都做到了,而且是以超乎人们想象的水平做到。

于是,很多人开始着急,急着寻找机会。

但是在寻找机会之前,建议你,一定沉下心,再看一看。

看懂这个席卷了我们一次又一次的GPT,到底是什么?

GPT-4

已知,GPT-4,应该比GPT-3.5厉害。但是,到底厉害在哪儿?

GPT-4正式发布前,有2个猜测:

1,GPT-4的机器学习参数,将从1750亿个,增加到100万亿个。能力差距,堪比一个月薪1750元的人,和一个月薪100万元的人。

2,GPT-4将支持多模态,也就是文字、图片、音频,甚至视频等。能力差距,堪比一个聋哑且盲的人,和一个耳聪目明的人。

相当震撼的猜测。

而openAI的老板Sam对此的回应是:一派胡言(complete bullshit)。

真的是一派胡言吗?

实际发布的结果是:GPT-4的能力,看起来确实提升了。

但是:

1,具体学习参数,没公布。OpenAI只给这次迭代定了个性: “GPT-4比GPT-3.5更可靠、更有创造力,并且能够处理更加细致复杂的指令”。

2,支持多模态,但是就多了一个图片,并且只支持你输入图片,轮到GPT输出时,依然只打字回你。

进步的步子迈多大,不明确,但大方向,却是大致准确的。

要真正理解GPT,这2个大方向,建议你真的看懂:大模型,多模态。

先说说,这次GPT-4最亮眼的更新:多模态。

多模态,很了不起吗?

多模态

多模态是什么?

想象一下,同事忽然发你一句微信消息:“嘘,王总在你后面。”

你收到后马上回头,看到王总,打了一声招呼:“王总。”

这件事,要做到,很了不起吗?

很了不起。短短几秒钟,你一口气处理了文字声音图像等多种信息数据。

多模态,就是多种信息数据的模式和形态。

而这些种类不同的信息数据,比如你在消息里认出的文字,回头看到的一个图像,嘴里说出的一段声音,有时还指向同一个信息:“王总”。

对你来说,在多模态中识别和对应出同一个“王总”,很简单,好像没什么了不起。

但对GPT来说,却是一个远大的理想:跨越多个模态,处理更复杂的任务。

这个理想,为什么远大?

因为,要做到,你首先得有眼睛和耳朵。

升级前的ChatGPT,只能摸索着,用文字和你交流。

但升级为GPT-4后,ChatGPT从此有了“眼睛”。

你发它一张图片,它能“看到”,还能“看懂”,并以此为基础,帮你处理更多任务。 比如,帮你P掉“王总”。

这,就是多模态之于GPT-4的意义:进化出了眼睛。

了不起。但,这还不是GPT-4进化的全部。

大模型

另一个被频繁提起的进步,是GPT-4的基本功――语言能力。

短短105天 ,GPT的语言模型,又得到了新一轮的进化。

一方面,“单词最大输出限制”,提高到了 25000 个单词。

原来,给它处理一篇文章,稍微字多点都不一定能发完整,现在,很多人甚至直接丢网页、PDF给它处理。

并且,在理解和回答问题,尤其是比较复杂的问题时,GPT-4也显得更聪明了。

怎么变聪明的?

简单来说,就是GPT-4的“大脑”变得更大,“神经元”变得更多了。

2018年的GPT,参数量是1.17亿。

2019年的GPT-2,参数量是15亿。

2020年的GPT-3,乃至后来基于GPT-3.5的ChatGPT,参数量是1750亿。

昨天发布的GPT-4,虽然官方没有公布具体参数量,但也没人会小看它的参数量。

GPT一出手,就是以亿为单位的参数量。而且每年还在疯狂翻倍。

这,就是提到GPT时,总会提到的“大模型”。

大量的参数,就像大量的神经元,这往往也意味着,更大概率能“猜中你想要的答案”。

人们常常把这种特点,称为:“聪明”。

GPT-4部分成绩单

想想这种量级的参数量,再看看GPT-4那些“碾压”人类的考试成绩单,似乎也能心理平衡了。

虽然,还是不太好接受:难道,要聪明到可以碾压90%的人类,只需要参数量够“大”就行了吗?

没那么简单。

训练

你有没有想过,当你打开ChatGPT的对话框,打出一个问题时,屏幕那边的ChatGPT,是怎么做这道题的?

比如你在对话框里问: “床前明月光,下一句是什么?”

作为一个人工智能,而不是人,ChatGPT从一开始,答题的路子,可能就和你完全不一样:

它根本不回忆,而是转头就去网上抓数据。看看都有哪些地方出现了“床前明月光”。

再用它那同时“考虑”上亿个参数的“脑子”算一件事:

排在这句之后的字,都有哪些?根据上下文,这些字是正确答案的概率都有多高?

然后转头就把算出来概率最高的文字,选出来,在对话框里回复你。

找组合,算概率,比大小。

你问的是语文题,它做的是数学题。

因为做数学题,才是模型的本质。

那,会不会做错呢?

会。如果,它从网上找的数据样本,刚好是一些错误很多的盗版书,最后通过计算,回复你的是“洒了一碗汤”,怎么办?

显然,模型并不在乎对错,但是人类在乎。

这时,人类就会做一件事:优化它,训练它。

怎么训练?

不如回想下,你是怎么做出这道题的?

首先你先在课本上看到过这首诗。

然后,再做过一些练习题。做完后对答案,有人告诉你对还是错。

对了,加分,你开心,从此记住答案是这个。

错了,扣分,你难过,再去找正确答案。

GPT,也差不多。

先“看书”,输入庞大的数据。

然后“做题”,并得到“反馈”。

做对,加分。做错,扣分。

和你不一样的是,AI不会开心和难过。

但,谁不喜欢分数高呢?

几亿个参数和相应的权重值都会根据这种分数反馈,再调整,再调整。

直到无限趋近于准确。

听起来是不是很完美?但,却有一个重大的难点。

成本

训练,是需要成本的。

参数量有多惊人,成本就有多惊人。

当一个需要同时“考虑”上千亿,甚至更多参数的“大脑”运转起来时,会需要哪些成本?

首先,每次训练,都能花掉上海几套房。

有数据显示,训练一次以GPT-3.5为模型的ChatGPT模型的成本,都要460万到500万美元。

此外,要入局GPT这种级别的产品,“入场券”也非常昂贵。

比如要达到相应的算力,光更早的GPT-3在训练中,都需要用到1万枚英 伟达GPU芯片。

以目前比较主流的英伟达A100芯片为例,一颗价格约8万元。

每颗8万元,1万颗,一开局光是芯片的花费,都要8亿元以上。

如果看到这还有勇气考虑,不妨参考ChatGPT的公司OpenAI。

OpenAI在之前基于GPT-3.5的ChatGPT上,就至少付了2大笔钱:

交给“机房”的钱,比如算力和数据,就要近20亿元。

交给“人”的钱,比如科学家、工程师的工资,也要近5亿人民币。

这,还不算每天可能高达几万美金的电费。

而新出来的GPT-4, 作为“更聪明”的“大脑”,算力成本可能又是一个新的台阶。

这些,都是“聪明”的价格。

如此昂贵,却总有人愿意付。

最后的话

比如,陆续投资了ChatGPT近900亿人民币的微软。

微软的必应搜索,在目前的全球搜索引擎市场中,份额占比为个位数,排在它前面的,是份额占比超90%的Google。

但是,在搭载了ChatGPT后,必应在它的搜索框里,昂首挺胸地设置了这么一句话:

Ask me anything…

昨天,GPT-4发布后,微软更是骄傲地宣布:

新版必应搜索,已经在更早,就用上了GPT-4,过去五周中很多人体验的必应就是GPT-4加强过的。

今天,百度也正式发布了文心一言。

它会成长为中国的OpenAI吗?

现在,还不知道。

中国,会有属于自己的GPT-4吗?

现在,也还不知道。

但是可以明确知道的是:不容易。

数据不容易,芯片也不容易。

但是,我们面对这种不容易的情况,还少吗?

以前怎么办,现在就怎么办。

祝福。

2023年,确定性在哪里?3月20日,下周一晚八点

点击下方按钮预约,分享一些我的感悟