บทที่ 9: Serving Data for Analytics, Machine Learning, and Reverse ETL

1 min read

การสร้าง Trust ใน Data

ก่อน serving data ต้องมี trust ใน data ก่อน — ถ้าคนไม่เชื่อถือ data จะไม่มีค่า

Business Intelligence (BI): อดีตและปัจจุบัน, reports, dashboards — แนวโน้ม self-service analytics
- Self-service analytics: ทุกคน access data และ slice/dice เองได้ — ทฤษฎีง่ายแต่ปฏิบัติยากเพราะ data quality
Operational Analytics: ปัจจุบัน, real-time, live view — inventory, system health
Embedded Analytics: customer-facing — hard ที่สุดเพราะ:
- Request rate สูงกว่ามาก
- Multitenancy: แต่ละ customer ต้องเห็นเฉพาะ data ของตัวเอง — data leak = disaster

Feature engineering → feature stores → model training → serving
Feature store: ลด operational burden สำหรับ ML engineers — maintain history, versions, sharing
อย่าเพิ่งทำ ML จนกว่าจะมี data foundation ที่ดี — ทำ analytics ให้เก่งก่อน

ส่ง processed data กลับไป ยัง source systems (CRM, ad platforms)

Security: row/column-level security, encryption, masking
Data Management: data validation, SLA (Service-Level Agreement) monitoring, cost optimization
DataOps: automation, monitoring, observability
Orchestration: dependency management สำหรับ serving pipelines