记录学习一些人工智能领域的专业名词含义,方便理解。
Token 词元
Token,也称为标记或词元,是语言处理中的一个基本单元。它通常代表一个单词、标点符号或一个特定的符号序列。Token是文本的基本组成单元,用于表示文本中的有意义的语言元素。例如,“Hello, world!”这个句子可以被划分为多个Token:“Hello”、“,”、“world”和“!”。
深度学习成为当今显学的原因
深度学习成为当今显学的主要原因是性能优越。实际上深度学习的基础技术几十年前就已经提出来了,那为什么最近十多年深度学习才开始火热?这主要是制约深度学习的两大因素:大数据集和高性能硬件在十多年前才达到深度学习的门槛。大数据集使深度学习能够充分的进行训练,而高性能硬件如CPU和GPU使深度学习的训练速度以指数级提升。
参考链接
- 自然语言处理中的文本token和tokenization详解,by KAKAKA.
- 深度学习基础介绍,by Yunhui1998.