Terms for computational science (update time to time)


  • Benchmark dataset คือ เซตของข้อมูลที่จะเอาไปใช้ในการสร้างโมเดลในการทำนายผล
  • Traning dataset คือ เซตของข้อมูล (benchmark dataset) ที่เราจะเอาไปสร้างโมเดล เพื่อหาความสัมพันธ์ในกลุ่มของข้อมูล
  • Validation dataset คือ เซตของข้อมูลที่จะนำไปทดสอบโมเดลการทำนายผล เพื่อดูว่าอัลกอรึทึ่มที่ใช้ในการสร้างโมเดลทำนายผลนั้นมีความแม่นยำเพียงใด
  • Curation คือ กระบวนการเตรียมข้อมูลจากแหล่งข้อมูลดิบเพื่อนำเอาไปใช้ในการประมวลผล หรือสร้างโมเดล

Comments

Popular posts from this blog

Useful links (updated: 2025-02-28)

Odd ratio - อัตราส่วนของความต่าง

Note: Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology