数据格式问题 #772

sevenandseven · 2024-05-13T01:37:24Z

你好，在评估msmarco指标时，是将content数据变为：
{"content": "A is ...", "B is ...", "C is ..."} 这种格式是吗？

每一个content后有多个候选的段落。

staoxiao · 2024-05-13T02:53:27Z

The data format is:

{"content": "A is ..."}
{"content": "B is ..."}
{"content": "C is ..."}
{"content": "Panda is ..."}
{"content": "... is A"}

, where each line is a dict containing a text instead of a list of text

You can refer to our example data: https://github.com/FlagOpen/FlagEmbedding/blob/master/examples/finetune/toy_evaluation_data/toy_corpus.json

sevenandseven · 2024-05-13T03:04:06Z

The data format is:
{"content": "A is ..."}
{"content": "B is ..."}
{"content": "C is ..."}
{"content": "Panda is ..."}
{"content": "... is A"}
, where each line is a dict containing a text instead of a list of text

You can refer to our example data: https://github.com/FlagOpen/FlagEmbedding/blob/master/examples/finetune/toy_evaluation_data/toy_corpus.json

"Thank you for your reply, I have succeeded in making it."

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

数据格式问题 #772

数据格式问题 #772

sevenandseven commented May 13, 2024

staoxiao commented May 13, 2024

sevenandseven commented May 13, 2024

数据格式问题 #772

数据格式问题 #772

Comments

sevenandseven commented May 13, 2024

staoxiao commented May 13, 2024

sevenandseven commented May 13, 2024