Terms for computational science (update time to time)


  • Benchmark dataset คือ เซตของข้อมูลที่จะเอาไปใช้ในการสร้างโมเดลในการทำนายผล
  • Traning dataset คือ เซตของข้อมูล (benchmark dataset) ที่เราจะเอาไปสร้างโมเดล เพื่อหาความสัมพันธ์ในกลุ่มของข้อมูล
  • Validation dataset คือ เซตของข้อมูลที่จะนำไปทดสอบโมเดลการทำนายผล เพื่อดูว่าอัลกอรึทึ่มที่ใช้ในการสร้างโมเดลทำนายผลนั้นมีความแม่นยำเพียงใด
  • Curation คือ กระบวนการเตรียมข้อมูลจากแหล่งข้อมูลดิบเพื่อนำเอาไปใช้ในการประมวลผล หรือสร้างโมเดล

Comments

Popular posts from this blog

Useful links (updated: 2024-04-26)

Genome editing technology short note

SUSA Thailand - Sustainable University? (update 2023-06-23)