Open-AI 刚刚公布了(le)其大型语言模型的最新(xīn)版本 ——GPT-4。
GPT-4 可以更准确地解(jiě)决(jué)你的难题(tí),多模态的 GPT-4 还可以生成、编辑具有创(chuàng)意性或技术(shù)性的文章,在高级推(tuī)理方面的表现超过(guò)其前辈(当前公开版 ChatGPT 基于 GPT-3.5)。当然,正如大家所猜测的那样,微软(ruǎn) New Bing 的(de)聊天功能(néng)确实基于 GPT-4。
此(cǐ)外,该公司正在与合作伙伴 Be My Eyes 一起测试 GPT-4 的图像输入能力(注:Be My Eyes 是一款即将推出的智(zhì)能手(shǒu)机(jī) App,可(kě)以识别场景并对其进行描述,类似于大家常见(jiàn)的 AI 识(shí)图的加强版)。
除了介绍网站,OpenAI 还提供了描述 GPT-4 功能的技术性论文,以及详细描述其局限性的系统模(mó)型 Card。

OpenAI 计划通(tōng)过 ChatGPT 及(jí)其(qí)商业 API 为(wéi)用(yòng)户提(tí)供(gòng) GPT-4 的文本功能(néng)支持(chí),但目前还需要等待。IT之(zhī)家这里需(xū)要提醒一下(xià),GPT4 目前仅 ChatGPT plus 账号可用,可选 GPT4 模式进(jìn)行对话,每 4 小时(shí)限制发送 100 条消息。
收费方(fāng)面,大约(yuē) 750 个单词的提示(shì)收取约 3 美分的(de)费(fèi)用,约 750 个单词(cí)的响应则收(shōu)取 6 美分(就是问和(hé)答的区别)。

据介绍,GPT-4 比以前的(de)版本“更大”,这意味着它已经借助比前辈(bèi)更多的数据进行了训练,并且(qiě)在模型文件中(zhōng)有更多的权重,从而使得它的(de)运行成本更高(gāo)。
就任(rèn)务而言,GPT-4 的表现比前辈(bèi)更好,它可以遵循自然语言的复(fù)杂指令并生成技术或创(chuàng)意内容,而且它可(kě)以还(hái)更深入地做到这一点:它支持生成(chéng)和处理多达 32768 个标记(约 25000 个(gè)文本单(dān)词(cí)),从而(ér)实现比(bǐ)前辈更长的内容(róng)创建或文本分析。
OpenAI 表(biǎo)示,GPT-4 错误答案更少,而且也会(huì)减少(shǎo)偏离话(huà)题的可能,也尽可能不会再谈论禁忌话题,甚至在许多(duō)标准化测试中比人(rén)类表现得(dé)都要更好一些。
例如,GPT-4 在模拟律师考试的成(chéng)绩在考生中排名前 10% 左(zuǒ)右,在 SAT 阅(yuè)读考(kǎo)试中排名前(qián) 7% 左(zuǒ)右,在 SAT 数(shù)学考试中排名前 11% 左右。相比之下,GPT-3.5 在律师考试中的得分(fèn)一般都是倒(dǎo)数 10% 左右。当然,它们考个研究(jiū)生(shēng)还是没(méi)问题的。

当然,AI 毕竟(jìng)是(shì) AI,OpenAI 也表(biǎo)示目(mù)前 GPT-4 并不完美,它在很多场景下的能力都不如(rú)人类。
据称,该模型仍然存在“幻(huàn)觉”或编造事实的问(wèn)题,并且(qiě)在事实(shí)方(fāng)面也(yě)不(bú)一定总是(shì)可(kě)靠的,“它倾向(xiàng)于坚持认为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性(xìng),例如社会偏见、幻(huàn)觉和对抗(kàng)性提示。