多轮对话训练效果 #254

chanel111 · 2024-05-14T03:38:47Z

我用llama3 qlora训练单轮和多轮的对话, 发现单轮学习的效果比较好，用训练语料里的问题去问，基本遵照答案去回答。但多轮的效果较差，每一轮不会遵循已经训练的内容去答，但按照项目里提到的训练方式，每一轮的回答应该和单轮的效果差不多吧，只有把前面几轮问题答案按照训练语料拼好预测最后一轮的答案，回答才会对齐训练语料里的内容。

所以这种多轮训练方式（把所有答案都mask放到一条数据里训）是不是没有起到太大作用，不如把1条多轮拆分成多条数据去训练效果好呀（4轮多轮拆成4条数据）？

有没有大佬可以指点一下多轮怎么训练才能把每一轮都学习进去并且比较高效呀~

ChenyuzZZ73 · 2024-05-15T05:29:10Z

想问一下你的多轮训练数据集有多少呀？为什么我的多轮对话训练的很慢，4快a100

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

多轮对话训练效果 #254

多轮对话训练效果 #254

chanel111 commented May 14, 2024 •

edited

ChenyuzZZ73 commented May 15, 2024

多轮对话训练效果 #254

多轮对话训练效果 #254

Comments

chanel111 commented May 14, 2024 • edited

ChenyuzZZ73 commented May 15, 2024

chanel111 commented May 14, 2024 •

edited