Terms for computational science (update time to time)

Terms for computational science (update time to time)

- July 21, 2019

Benchmark dataset คือ เซตของข้อมูลที่จะเอาไปใช้ในการสร้างโมเดลในการทำนายผล
Traning dataset คือ เซตของข้อมูล (benchmark dataset) ที่เราจะเอาไปสร้างโมเดล เพื่อหาความสัมพันธ์ในกลุ่มของข้อมูล
Validation dataset คือ เซตของข้อมูลที่จะนำไปทดสอบโมเดลการทำนายผล เพื่อดูว่าอัลกอรึทึ่มที่ใช้ในการสร้างโมเดลทำนายผลนั้นมีความแม่นยำเพียงใด
Curation คือ กระบวนการเตรียมข้อมูลจากแหล่งข้อมูลดิบเพื่อนำเอาไปใช้ในการประมวลผล หรือสร้างโมเดล

Comments