[RE: ท่านไหนทำงานด้าน etl data warehouse บ้างครับ (data engineering)]
norranun พิมพ์ว่า:
oattie พิมพ์ว่า:
norranun พิมพ์ว่า:
oattie พิมพ์ว่า:
ผมทำเป็น data analyst/engineer ที่บริษัทแห่งหนึ่ง แล้วแต่คนชอบนะครับ
ส่วนตัวผมทำเป็น software engineer มาก่อน แต่ชอบทำเกี่ยวกับการวิเคราะห์ข้อมูล และ สถิติ และ ทำงานเกี่ยวกับ data โดยตรง
จึงย้ายส่ยงานมาด้านนี้ ที่ไทยผมไม่ค่อยแน่ใจนะครับ แต่ที่อังกฤษนี่งานค่อนข้างงท้าทายเลย ได้จับเทคโนโลยีใหม่ๆ แล้วก็ data volume ใหญ่มากๆ ทั้ง structured และ unstructured data.
งานไม่จำเจครับเจออุปสรรคตลอดต้องหาทางแก้และสร้าง data pipeline เพื่อดึง data จาก in-house systems
ผมชอบที่ทีมอื่นๆนำเอาข้อเสนอแนะจากข้อมูลที่เราวิจัยไปประกอบการตัดสินใจต่างๆ
ผมตอบอาจจะรวบๆ data analyst ด้วย แต่โดยรวมผมชอบครับท้าทายดีเพราะ skillset ต้องกว้างพอสมควร
ผมเป็น data analyst พันธุ์ทางครับ หมายถึงผมไม่ได้จบไอทีมา ผมจบการตลาด แต่มาเรียน sql กับ excel เอาเองภายหลัง แล้วก็ใช้ powerbi เป็นนิดหน่อย เลยได้มาเป็น data analyst ซะงั้น
แต่ผมคิดว่ากำลังจะลงเรียนคอรส data engineer แบบออนไลน์กับกรุ๊ปๆนึงในเฟสบุค แล้วไปหาสมัครงานพวก etl developer (คือไม่อยากทำ analyst ละ)
แต่ไม่แน่ใจว่าจะหางานได้ไหม ด้วยความที่อายุก็ 33 ละ จะไปเป็น junior etl developer มันก็ดูแปลกๆ อายุดูมากไปหน่อยถ้า 28-29 ยังพอทน
ผมก็ใช้ Power BI เป็นหลักเหมือนกันครับ ว่าแต่ทำไมอยากเป็น data engineer ล่ะครับไม่ชอบ data analyst หรอ
ผมมองว่าในอนาคต data scientist น่าจะเข้ามาแทน data analyst น่ะสิครับ ในมุมมองผม ผมมองว่า data scientist นาจะทำทุกอย่างที data analyst ทำได้ ในขณะที่ data analyst ไม่สามารถทำได้ทุกอย่างที่ data scientist ทำได้ ผมเลยมองว่า data analyst จะเป็นตำแหน่งทีถูกกลืนหายไปไม่ช้าก็เร็ว
ที่สำคัญผมไม่เก่งคำนวณเท่าไร พากสถิติก็ไม่ได้(ถ้าจะมาเรียนเพิ่ม คือคิดว่าตัวเองไม่ชอบคำนวณ เลยไม่อยากไปต่อละ)
Data Analyst ที่ดีอีกอย่างคือต้องเข้าใจ business นั้นๆ ซึ่งผมก็ไม่ใช่คนที่่เก่ง business อีก
ด้วยเหตุผลที่กล่าวๆไปนั้นแหละ ผมเลยตัดสินใจอยากไปทำ database เพียวๆ เพราะเป็นสิ่งที่ผมถนัดสุด
ผมเดาว่า etl คงไม่มีอะไรเกี่ยวกับการคำนวณตัวเลขสักเท่าไร แค่เข้าใจ database กับ เขียนพวก python(ซึ่งผมเรียนแล้วรู้สึกว่าเออ เราเข้าใจการเขียนโปรแกรมได้ นาจะไปต่อกับตรงนี้ได้) เขียนเชื่อม api อะไรแบบนี้ ยังไงก็ไม่นาจะยากไปกว่าการเขียนโปรแกรมของพวก software developer แน่นอน น่าจะใช้โค้ดเพียงไม่กี่คำสั่งในการทำ etl
อันนี้ผมลองประเมินของผมเองอ่ะนะท่าน ผมประเมินดูแล้วผมอยากไปพวก etl พวก data warehouse มากกว่าสาย data analyst
Data Analyst ไม่หายไปอย่างแน่นอนคับ มันคนละ role กับ Data Scientist
Responsibility ต่างกันครับ แต่ที่คุณเข้าใจแบบนั้นก็ไม่ผิดเพราะ skillsets overlap กันพอสมควร
Roles ที่ผมกำลีงจะกล่าวถึงหลังจากนี้ มี common skillsets หลายๆอย่างเหมือนกัน:
Data Analyst, Data Engineer, Data Scientist, Dev Ops, Machine Learning Engineer
ถ้าทำได้ทุกแบบ ลงลึกได้หมดทุกแขนงที่กล่าวมา ก็จะเป็น Data Science Unicorn แทน
ผมเชียร์ให้อาชีพพวกนี้นี้เติบโตขึ้นที่ที่ไทย แต่ว่าตอนนี้ demand ยังน้อยอยู่เลยครับ
แล้วก็จริงๆแล้ว ETL ไม่ได้ focus อยู่ที่ database เสมอไปขึ้นอยู่กับ environment และ business requirements ของบริษัทนั้นๆ
เช่น ถ้าบริษัทใช้ SQL Server เป็นหลักก็สามารถทำ ETL บน SSIS ได้โดยตรงถ้า ข้อมูที่จะนำเข้ามาใน data warehouse เป็น batch ingestion.
บางที่อาจจะใช้ Spark ที่รันบน Hadoop เพื่อทำการ transform big dataset แล้วโหลด data ลง Data Lake หรือ dimensionalise data ลง data warehouse.
บางที่ดึง real-time data ที่ stream จาก Kafka แล้ว transform data ไปยัง KafkaSQL
หรือจะใช้ Airflow, MemSQL, Alteryx ในการช่วย ETL ก็ได้
ส่วนตัวผมเลยชอบด้านนี้พอสมควรเพราะมีโอกาสได้ทำงานค่อนข้างท้าทาย และได้จับเทคโนโลยีใหม่ๆ
ผมอยากให้บริษัทที่ไทยวางแผน และ มีนโยบายเกี่ยวกับ data จริงๆจังๆ ซักทีจะได้เปิดกว้างให้กับคนรุ่นใหม่ๆบ้าง
คุยเรื่องนี้ยาวครับผมยินดีที่จะแชร์ ประสบการณ์โดยตรง ยังไงหลังไมค์มาได้นะครับ