Terms for computational science (update time to time)


  • Benchmark dataset คือ เซตของข้อมูลที่จะเอาไปใช้ในการสร้างโมเดลในการทำนายผล
  • Traning dataset คือ เซตของข้อมูล (benchmark dataset) ที่เราจะเอาไปสร้างโมเดล เพื่อหาความสัมพันธ์ในกลุ่มของข้อมูล
  • Validation dataset คือ เซตของข้อมูลที่จะนำไปทดสอบโมเดลการทำนายผล เพื่อดูว่าอัลกอรึทึ่มที่ใช้ในการสร้างโมเดลทำนายผลนั้นมีความแม่นยำเพียงใด
  • Curation คือ กระบวนการเตรียมข้อมูลจากแหล่งข้อมูลดิบเพื่อนำเอาไปใช้ในการประมวลผล หรือสร้างโมเดล

Comments

Popular posts from this blog

Useful links (updated: 2024-10-23)

Odd ratio - อัตราส่วนของความต่าง

Note: A Road to Real World Impact (new MU-President and Team) - update 12 Sep 2024