บทที่ 9: Serving Data for Analytics, Machine Learning, and Reverse ETL
1 min readการสร้าง Trust ใน Data
ก่อน serving data ต้องมี trust ใน data ก่อน — ถ้าคนไม่เชื่อถือ data จะไม่มีค่า
- Trust → Data products → Self-service → Data-driven culture
3 ประเภท Analytics
- Business Intelligence (BI): อดีตและปัจจุบัน, reports, dashboards — แนวโน้ม self-service analytics
- Self-service analytics: ทุกคน access data และ slice/dice เองได้ — ทฤษฎีง่ายแต่ปฏิบัติยากเพราะ data quality
- Operational Analytics: ปัจจุบัน, real-time, live view — inventory, system health
- Embedded Analytics: customer-facing — hard ที่สุดเพราะ:
- Request rate สูงกว่ามาก
- Multitenancy: แต่ละ customer ต้องเห็นเฉพาะ data ของตัวเอง — data leak = disaster
Machine Learning Serving
- Feature engineering → feature stores → model training → serving
- Feature store: ลด operational burden สำหรับ ML engineers — maintain history, versions, sharing
- อย่าเพิ่งทำ ML จนกว่าจะมี data foundation ที่ดี — ทำ analytics ให้เก่งก่อน
Reverse ETL
ส่ง processed data กลับไป ยัง source systems (CRM, ad platforms)
- จาก antipattern → product category (Census, Hightouch)
- Marketing analysts เคยทำ manual ใน Excel — ปัจจุบัน automate
Undercurrents ในการ Serving
- Security: row/column-level security, encryption, masking
- Data Management: data validation, SLA (Service-Level Agreement) monitoring, cost optimization
- DataOps: automation, monitoring, observability
- Orchestration: dependency management สำหรับ serving pipelines