(相关资料图)
为了方便大家从整体了解人工智能训练的过程,避免因为过多的概念影响对整体的理解,我们绘制了这张流程图。
人工智能训练过程图
数据收集:收集用于训练的数据,输出原始数据(未经处理的数据集)数据预处理:清洗和格式化数据,输出预处理数据(适合模型训练的数据)模型初始化:设定模型的初始参数,输出初始化模型(设定初始参数的模型)模型训练:使用数据训练模型,输出训练模型(经过一轮训练的模型)模型评估:评估模型的性能,输出评估结果(模型的性能指标)模型优化:根据评估结果优化模型,输出优化模型(经过优化的模型)模型部署:将模型应用于实际环境,输出最终模型(满足要求的模型)下图是ChatGPT的工作流程简图:
ChatGPT工作流程简图
一、用户输入:用户提供的原始输入。
二、输入处理:处理用户的输入,准备送入模型。
分词器:将输入的文本分解为可以被模型理解的小块(token)。Tokenization:将输入的文本转换为token的过程。三、ChatGPT模型:接收处理后的输入,开始生成回复。
Transformer模型:ChatGPT模型的核心部分,用于理解输入和生成回复。自注意力机制:Transformer模型的关键部分,用于理解输入中的各个部分之间的关系。多头注意力:自注意力机制的一部分,允许模型同时关注输入的多个部分。缩放点积注意力:多头注意力的一部分,计算输入部分之间的关系。生成回复:根据理解的输入和学习到的模式,生成回复。四、输出处理:处理模型生成的输出,准备展示给用户。
反分词器:将模型生成的token重新组合成人类可读的文本。Detokenization:将token转换回文本的过程。五、用户看到回复:用户看到最终的回复。
Token样例
标签: