《科创板(bǎn)日报》12月28日讯(编(biān)辑 宋子乔) 众多专业学科中,医学(xué)以难度(dù)强、压(yā)力大(dà)著称(chēng),但仍有(yǒu)无数人接(jiē)受挑战,选择迎(yíng)难而上,如今,AI也跑来和医学生“抢饭碗”。
当地(dì)时(shí)间12月27日,谷歌(gē)公布了一个新的医疗(liáo)AI模型“Med-PaLM”。在经历(lì)一系列考核后,该模型(xíng)被证实“几乎达到”了人类医生的水(shuǐ)平。
![]()
具体来看,研究团(tuán)队准备了一个(gè)医学问(wèn)题问答数(shù)据(jù)集(jí)“MultiMedQA”,涵盖医学考试、医学研究和消费(fèi)者(zhě)医学(xué)问题,该“题库(kù)”收集了MedQA(USMLE,美国医(yī)师执照(zhào)考试题),还引入了他们自己的新数(shù)据集(jí)HealthSearchQA,它由搜索过的(de)健康(kāng)问(wèn)题(tí)组成。
该(gāi)团(tuán)队又请(qǐng)来一组临(lín)床医生作答。这些临床医生分布于美(měi)国和英国,在初级保健、外科、内科和儿科方面具有专业经验。
最后,研究人员将模型和(hé)人类医生的答案匿名后交给9名分别(bié)来自美国、英国和(hé)印度的(de)临床医生进行(háng)评(píng)估。
结果显示,Med-PaLM在科学常识方面的正确(què)率在92%以上(shàng),在理解、检索和推理能力(lì)方面,也(yě)几(jǐ)乎达到了人类(lèi)医生的水(shuǐ)平,并在克服隐性偏见方面略胜一(yī)筹(chóu)。
不过,该研究(jiū)负(fù)责人也表示,Med-PaLM给出的答案(àn)在(zài)整体上(shàng)仍然(rán)不如临(lín)床(chuáng)医生,该模(mó)型在实际应用前(qián)有待(dài)进一步完善。
追根(gēn)溯源,Med-PaLM是怎么诞生的呢?
这里不得不(bú)提谷歌在今年发布的转(zhuǎn)换器语言模(mó)型(xíng)——PaLM,该模型基于Pathways架构、拥有5400亿参数,是Google迄今为止研发(fā)的最大规模的模型(xíng),全名为Pathways Language Model。
PaLM模型在语言理解等各种方面的评估测试(shì)中的表现(xiàn)十分(fèn)出色(sè),甚(shèn)至(zhì)还在语言和推理类的测评中超过了人(rén)类(lèi)。
Med-PaLM正是PaLM的衍生品。谷歌研究团队首先在(zài)上文提及的医学问题问答数据集“MultiMedQA”上评估了PaLM及微调变体Flan-PaLM,然后,基于此提出了指令提示x调整,让(ràng)Flan-PaLM进一步与医学接轨,进一步产生(shēng)了Med-PaLM。
值得注意的是(shì),AI模型的每一次突破,都预示着更聪明的机器人(rén)即将到来。指(zhǐ)挥机器人干活不是什么新奇的事,但要让机器人能够理解你的命(mìng)令背后的意图,那就要考验它的“大脑”好不好用了(le)。将AI模型应用到机器(qì)人(rén)身上相当(dāng)于给机器人(rén)“开(kāi)智”。
据了解,今年(nián)8月份,谷歌就将大型语言模(mó)型(xíng)首次(cì)集成到机器人中,有了AI模型的(de)加持,机器(qì)人能像人类一样响应完整的命令(lìng)。
谷(gǔ)歌研(yán)究人员就此做了演示。当对(duì)机器人说:“我饿了,你能给我点零食吗(ma)?”机器人在自助(zhù)餐厅中搜索一番(fān)后,打开了一个(gè)抽(chōu)屉,找到一袋(dài)薯片并将(jiāng)它拿(ná)给(gěi)研究人员。
可以预见的是(shì),通过进一步的训练(liàn)、优化,Med-PaLM模型的回答准确率将进一步(bù)提高,基于此模(mó)型的机器人(rén)医生也有望更快(kuài)出现(xiàn)。