关于《千航模型-二次元AI智能体》训练报告-其1

关于《千航模型-二次元AI智能体》训练报告-其1

千航模型-二次元AI智能体

前言

千航模型-二次元AI智能体是由小新科技互联网工作室(宇晨小新)训练的AI智能体。位于2025年开始研发。目前模型采用python语言与TensorFlow框架和CNN 即卷积神经网络(Convolutional Neural Network)共同研发训练。训练数据共有925行,同义词共有37行。

模型中文同义词

 

同义词可以提高语言理解能力

 

  • 增强语义理解准确性:帮助模型更全面地理解用户输入的内容。例如,当用户询问 “电脑运行速度慢怎么办” 时,模型能知道 “电脑” 和 “计算机” 是同义词,从而准确理解问题,避免因表述不同而出现理解偏差。
  • 识别语义相似问题:对于意思相近但表述不同的问题,模型可以通过同义词识别将它们归为一类,进而提供统一或相似的回答。比如,“如何提升手机续航能力” 和 “怎样增强手机电池续航时长”,模型能凭借同义词知识明白这两个问题本质是一样的。

同义词可以丰富语言表达

 

  • 避免回答单一:在生成回答时,模型可以使用同义词来替换一些词汇,使回答更加丰富多样。比如在介绍某种产品优点时,不会一直重复使用 “好” 这个词,而是会用 “优秀”“出色”“卓越” 等同义词来增加表达的多样性。
  • 使对话更自然流畅:在对话过程中,合理使用同义词能让交流更自然。例如,当用户说 “我喜欢吃苹果”,模型可以回应 “苹果确实是很受欢迎的水果,它富含多种维生素,对身体很棒,你还喜欢吃其他类似的水果吗,比如梨或者桃”,用 “棒” 替换 “好”,让对话更自然生动。

同义词可以优化搜索与匹配

 

  • 提高搜索效率:在搜索相关知识或信息时,同义词可以扩大搜索范围。比如用户搜索 “人工智能的应用领域”,模型会将与 “人工智能” 同义的 “AI” 等词汇也纳入搜索范围,从而更全面地找到相关资料。
  • 精准匹配内容:在匹配用户需求和已有数据、知识图谱等内容时,同义词能提高匹配的精准度。比如在知识图谱中,关于 “汽车” 的信息可能会与 “轿车”“客车” 等同义词建立关联,以便更准确地为用户提供相关知识。

同义词可以提升用户体验

 

  • 增强交互友好性:让用户感觉模型更智能、更懂自己,无论用户使用哪种表达方式,模型都能理解并做出合适回应,减少用户因表述问题而得不到满意回答的情况,提高用户与模型交互的友好性和满意度。
  • 适应不同用户习惯:不同用户有不同的语言习惯和表达方式,同义词的运用能使模型适应各种表述方式,更好地服务不同用户群体。比如对于 “自行车” 这个概念,有的用户习惯说 “单车”,有的习惯说 “脚踏车”,模型都能理解并进行有效沟通。
"可爱": ["萌", "软萌", "卡哇伊", "Q弹", "萌萌哒", "可耐"],
        "喜欢": ["喜爱", "中意", "稀罕", "粉", "钟情", "超爱"],
        "无聊": ["无趣", "乏味", "没劲", "没劲儿", "无聊透顶", "寡淡"],
        "疲惫": ["疲倦", "劳累", "困乏", "累瘫", "心力交瘁", "疲顿"],
        "美丽": ["漂亮", "秀丽", "绝美", "惊艳", "美腻", "靓绝"],
        "帅气": ["英俊", "潇洒", "俊朗", "酷炫", "拽帅", "型男"],
        "兴奋": ["激动", "亢奋", "欢腾", "嗨翻", "热血沸腾", "雀跃"],
        "害怕": ["恐惧", "惧怕", "畏惧", "胆寒", "瑟瑟发抖", "怕怕"],
        "生气": ["恼怒", "愤怒", "气愤", "发飙", "炸毛", "火大"],
        "温柔": ["温和", "柔和", "温婉", "软萌温柔", "柔婉", "温软"],
        "有趣": ["风趣", "诙谐", "有意思", "逗趣", "超好玩", "妙趣横生"],
        "开心": ["快乐", "愉悦", "欢乐", "嗨皮", "美滋滋", "乐开花"],
        "难过": ["伤心", "悲痛", "哀伤", "心碎", "emo了", "黯然神伤"],
        "期待": ["期盼", "盼望", "渴望", "憧憬", "眼巴巴", "翘首以盼"],
        "惊喜": ["惊讶", "惊异", "惊奇", "惊呆了", "喜出望外", "吓一跳"],
        "温暖": ["暖和", "温馨", "和煦", "暖融融", "暖呼呼", "温情"],
        "寒冷": ["冰冷", "严寒", "酷寒", "冷飕飕", "冷冰冰", "寒冽"],
        "炎热": ["酷热", "炽热", "燥热", "火辣", "热炸了", "滚烫"],
        "凉爽": ["清凉", "清爽", "凉快", "凉飕飕", "冷爽", "舒爽"],
        "美味": ["可口", "好吃", "香甜", "超赞", "美滋滋", "味蕾盛宴"],
        "难吃": ["苦涩", "难吃", "乏味", "难以下咽", "呕吼难吃", "寡淡无味"],
        "安静": ["宁静", "寂静", "静谧", "鸦雀无声", "悄咪咪", "安静如鸡"],
        "热闹": ["喧闹", "嘈杂", "热闹非凡", "人山人海", "欢闹", "热火朝天"],
        "聪明": ["聪慧", "机灵", "睿智", "鬼灵精", "智多星", "冰雪聪明"],
        "愚蠢": ["愚笨", "愚昧", "笨拙", "傻憨憨", "呆瓜", "榆木脑袋"],
        "善良": ["和善", "仁慈", "好心", "小天使", "菩萨心肠", "心地善良"],
        "邪恶": ["恶毒", "凶狠", "残暴", "大反派", "坏透顶", "邪魅狂狷"],
        "勇敢": ["英勇", "果敢", "无畏", "胆大包天", "勇往直前", "铁血硬汉"],
        "胆小": ["怯懦", "胆怯", "胆小怕事", "怂包", "胆小鬼", "缩头乌龟"],
        "大方": ["豪爽", "大气", "慷慨", "阔气", "不吝啬", "出手阔绰"],
        "小气": ["吝啬", "抠门", "小气鬼", "铁公鸡", "一毛不拔", "吝啬鬼"],
        "真诚": ["真挚", "诚恳", "真心", "实心眼", "坦诚", "掏心窝子"],
        "虚伪": ["虚假", "伪善", "做作", "假惺惺", "装蒜", "表里不一"],
        "坚强": ["坚韧", "顽强", "刚强", "铁打的", "硬骨头", "百折不挠"],
        "脆弱": ["柔弱", "软弱", "娇嫩", "玻璃心", "弱不禁风", "一碰就碎"],
        "活泼": ["开朗", "活跃", "灵动", "古灵精怪", "蹦跶", "活力满满"],
        "内向": ["腼腆", "羞涩", "文静", "闷葫芦", "害羞宝宝", "含蓄内敛"]

详细说明

模型训练共计1000次,训练500次发现模型的各项指标较弱

损失: 0.0179,准确率: 0.9973,验证损失: 0.1163,验证准确率: 0.9892,当前 GPU 内存使用: 646.02 MB

  • 损失(Loss):损失函数是用于衡量模型预测结果与真实标签之间差异的指标。训练过程中,模型会通过调整参数来最小化损失值。这里的损失值为 0.0179,说明在训练集上,模型的预测结果与真实标签的平均差异较小,模型在训练数据上拟合得较好。
  • 准确率(Accuracy):准确率是指模型预测正确的样本数占总样本数的比例。0.9973 的准确率意味着在训练集上,模型能够正确预测出 99.73% 的样本标签,这是一个非常高的准确率,表明模型在训练数据上表现出色。
  • 验证损失(Validation Loss):验证损失是在验证集上计算得到的损失值。验证集是在训练过程中用于监控模型泛化能力的数据集合,与训练集相互独立。这里的验证损失为 0.1163,比训练损失要大,这是比较常见的现象,通常说明模型在验证集上的表现不如在训练集上那么好,但整体仍然处于可接受的范围。
  • 验证准确率(Validation Accuracy):验证准确率是模型在验证集上正确预测的样本数占验证集总样本数的比例。0.9892 的验证准确率表明模型在验证集上也有较高的准确性,能够正确预测出 98.92% 的验证样本标签,说明模型具有较好的泛化能力,能够在未见过的数据上有较好的表现。
  • 当前 GPU 内存使用(GPU Memory Usage):显示了模型在训练或推理过程中当前使用的 GPU 内存量为 646.02MB。这对于评估模型的资源占用情况非常重要,如果 GPU 内存使用过高,可能会导致设备出现内存不足的情况,影响模型的训练或推理速度,甚至导致程序崩溃。

Ai智能体

        小新科技互联网工作室

2025年02月03日

 

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容