开栏的话:
当人工智能(AI)走进现实,你是否也想参与到AI的讨论和应用中来?为提高公众尤其是医务人员的AI基础素养,健康报开设“人工智能一点通”栏目及“秒懂AI”融媒体栏目,以通俗文字和趣味视频科普AI相关基础概念。一起来学习与医疗健康相关的人工智能关键概念吧!
本期关键词:人工智能大模型
大家可能经常会听到“人工智能大模型”一词。它是什么意思?它究竟“大”在哪?
我们先把“人工智能大模型”拆解成“人工智能”“大”“模型”3个词。
“人工智能”一词最好理解,就是让机器通过学习,像人一样思考和解决问题。
“模型”就是一个“数学机器”或“程序”,它的厉害之处是能从外部“投喂”数据中学习和总结规律。当人们给模型输入内容,它能根据学到的规律快速给出答案。比如,一个识别苹果的模型,你给它一张图片,它能快速输出“这是苹果”或“这不是苹果”。
要理解“大”字的含义,我们要先了解另一个概念——参数。所谓参数,就是模型通过学习总结出来的“经验法则”或“内部笔记”,就像我们在上课时记下的一条条总结性知识点。
大模型和小模型的根本区别在于前者能通过海量参数,完成复杂的推理任务。大模型的“大”主要是指参数量大。不过,多少参数才算“大”呢?这个问题还没有定论。
2018年,世界上最大的模型大概有3亿个参数。到了2021年,GPT-3模型的参数量已经达到1750亿。2025年,国产大模型DeepSeek的参数量约6710亿。
目前,业内一般认为,参数量越大,模型性能越好。相关研究也发现,当模型参数量提升到一定程度时,模型会出现神奇的“涌现”现象,就好比一个学武之人博览天下武功秘籍后,突然打通任督二脉,功力获得成百上千倍的提升。
由此可见,要提升模型性能,短期内可借助提升参数量来实现,不过,模型设计方面的突破性进展依然备受期待。
学术支持:复旦大学智能医学研究院
编辑:夏海波 马杨
校对:杨真宇
审核:李诗尧 徐秉楠
【未经授权,严禁转载!联系电话028-86968276】
