• author: Minseok Kim
  • created: 2024-02-22
  • updated: 2024-02-22

KorQuAD v1.0

๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์กฐ

  • KorQuAD_v1.0_train.json : ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ์…‹ : ์ด 60407๊ฐœ ์งˆ๋ฌธ-๋‹ต๋ณ€

  • KorQuAD_v1.0_dev.json : ํ…Œ์ŠคํŠธ์šฉ ๋ฐ์ดํ„ฐ์…‹ : ์ด 5774๊ฐœ ์งˆ๋ฌธ-๋‹ต๋ณ€

  • prediction.json : ํ…Œ์ŠคํŠธ์šฉ ๋ฐ์ดํ„ฐ์…‹์˜ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋ชจ๋ธ์˜ ๋Œ€๋‹ต

  • evaluate-v1.0.py : KorQuAD_v1.0_dev.json ๊ณผ prediction.json์˜ ์„œ๋กœ๊ฐ„์˜ ๋‹ต๋ณ€์„ ๋น„๊ตํ•˜์—ฌ ์„ฑ๋Šฅ์„ ์ธก์ •ํ•˜๋Š” ์Šคํฌ๋ฆฝํŠธ

  • KorQuAD_v1.0 ๋ฐ์ดํ„ฐ์…‹์€ Title โ†’ Context โ†’ Question ๊ตฌ์กฐ๋กœ ๊ตฌ์„ฑ๋จ


ํ…Œ์ŠคํŠธ

1. ๋ฐ์ดํ„ฐ์…‹ ์งˆ๋ฌธ ์ถ”์ถœ

  • KorQuAD_v1.0_dev.json ์—์„œ ๋ชจ๋ธ์— ์ž…๋ ฅํ•  ์งˆ๋ฌธ ๋ฆฌ์ŠคํŠธ ์ถ”์ถœ
  • ๊ธฐ์กด Title โ†’ Context - > Question ๊ตฌ์กฐ์—์„œ Question ๋‹จ์œ„๋กœ ์ถ”์ถœํ•จ

+full

2. Prediction

  • ๊ฒ€์ฆํ•˜๊ณ ์žํ•˜๋Š” ๋ชจ๋ธ์„ ๋ถˆ๋Ÿฌ์™€ ์งˆ๋ฌธ๋ฆฌ์ŠคํŠธ์˜ ๊ฐ ์งˆ๋ฌธ์„ ์ž…๋ ฅํ•˜์—ฌ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•จ
  • ์ด๋•Œ, ์งˆ๋ฌธ๊ณผ ํ•จ๊ป˜ context ์ •๋ณด๋ฅผ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Œ

+full

3. ๊ฒฐ๊ณผ ์ €์žฅ

  • ID : Answer ๋”•์…”๋„ˆ๋ฆฌ ๋ชจ์Œ์˜ ํ˜•ํƒœ๋กœ prediction.json ํŒŒ์ผ ์ €์žฅ

+full

4. ์„ฑ๋Šฅ ์ธก์ •

  • evaluate-v1.0.py ํŒŒ์ผ์„ ์‹คํ–‰ํ•˜์—ฌ f1 score ์ธก์ •
  • >> python evaluate-v1.0.py dev_data_path prediction_data_path

+full