Posts

Showing posts from July, 2019

Terms for computational science (update time to time)

Benchmark dataset คือ เซตของข้อมูลที่จะเอาไปใช้ในการสร้างโมเดลในการทำนายผล Traning dataset คือ เซตของข้อมูล (benchmark dataset) ที่เราจะเอาไปสร้างโมเดล เพื่อหาความสัมพันธ์ในกลุ่มของข้อมูล Validation dataset คือ เซตของข้อมูลที่จะนำไปทดสอบโมเดลการทำนายผล เพื่อดูว่าอัลกอรึทึ่มที่ใช้ในการสร้างโมเดลทำนายผลนั้นมีความแม่นยำเพียงใด Curation คือ กระบวนการเตรียมข้อมูลจากแหล่งข้อมูลดิบเพื่อนำเอาไปใช้ในการประมวลผล หรือสร้างโมเดล