Top Comment [RE: ถามพี่ๆที่ทำงานสายdataครับ]
Peachoo พิมพ์ว่า:
ผมสนใจทำdata analyticsครับ แต่ยังใหม่กับด้านนี้กำลังเรียนออนไลน์เก็บใบcerอยู่คับ
อยากถามว่าช่วงก่อนไปสมัครงานจริง ระหว่างเรียนออนไลน์เก็บใบเซอร์,ฝึกทำproject กับ ไปฝึกงานพวกงานmarketingหรืองานcustomer ที่มันใช้ความรู้โปรแกรมในสายdataบ้าง
อย่างไหนมีประโยชน์กว่ากันครับ ถ้าเกิดไม่ได้ฝึกงานแต่เคยทำprojectบริษัทจะมีสิทธิ์รับเข้าทำงานมากกว่าไหมครับ
และก็ถ้าฝึกงานแนะนำฝึกงานแบบไหนดีครับ แนะนำผมที
สมัยก่อนสัก4-5ปี เค้าดูที่วุฒิ(ไม่ใช่จบตรงสายนะ แต่พวกป.เอก จบนอกไรงี้)
ยิ่งอ้างว่าเขียนโค้ดได้หลายแบบยิ่งรับทันที
แต่ปัจจุบันเปลี่ยนไปแล้ว เพราะหลายๆที่เริ่มรู้ว่าทีมดาต้าที่สร้างมานั้นไม่ได้สร้างผลลัพธ์ที่น่าพอใจเลย
ประสบการณ์และผลลัพธ์ที่เคยทำ นี่แหละจะเป็นตัวบอกโอกาสในการรับเข้าทำงานมากกว่าครับ
ทีนี้การที่ผลลัพธ์มันจะว้าว ไม่ใช่เพราะการใช้โมเดลแปลกใหม่ หรือสมการซับซ้อน หรือโค้ดภาษาใหม่ๆเลย
มันอยู่ที่ความเข้าใจถึงปัญหาทางธุรกิจ และการประยุกต์แก้ปัญหาที่ใหม่และง่าย มากกว่าครับ (มีโจทย์ให้ลองทำท้ายข้อความ)
ถ้าถามผม ผมจะถามผู้สมัครอยู่เสมอว่ายกผลงานที่ประสบความสำเร็จที่สุดเกี่ยวกับการใช้ดาต้า มาเล่าให้ฟัง
รวมไปถึงอยากลองฟังไอเดียจากคำถามปลายเปิด เพื่อดูว่ามีกระบวนการคิดที่เป็นตรรกะและสดใหม่ไหม
ส่วนเรื่องใบเซอร์ เห็นมาเยอะ พวกเพจต่างๆ แนะนำนุ้นนี่ ถามว่ามีดีกว่าไหม แน่นอนครับ
แต่ผมยังไงก็มองว่าประสบการณ์ที่เคยทำด้วยตัวเองสำคัญสุด ถึงแม้ว่ายังไม่เคยทำงานหรือฝึกงาน
ถ้าเรามีดาต้าฟรีๆในเวปต่างๆ(หรือเวปสอน) แต่เราสามารถโชว์ไอเดียการวิเคราะห์ การเข้าใจถึงดาต้า+ธรุกิจ
มันจะทำให้ว้าวได้เช่นกัน
คำว่า data analytics/data science มันประกอบด้วย3ส่วน(อย่างที่รู้ๆกัน)
Stat Business Coding ผมให้valueกับbusinessและstatมากกว่าเสมอ
ในอนาคตโปรแกรมสำเร็จรูปจะมีเยอะขึ้น และง่ายต่อการใช้งานมากขึ้น
ส่วนคำถามที่ให้ลองเอาไปตอบดู(PMคำตอบมาได้ครับ จะช่วยดูให้)
1. บริษัทอสังหาประเทศไทย จะมีทีมในการสำรวจราคาคอนโดและที่ดินเปล่าในกทม. ทีนี้การสำรวจ มันจะเป็นรอบๆ และรายปี ซึ่งแต่ละปีก็จะมีข้อมูลไม่เหมือนกัน คือ คอนโดตึกที่สร้างเสร็จไปแล้ว ปีถัดไปก็จะไม่มีราคา เพราะขายหมดแล้ว มีแต่ราคามือสอง หรือบางเขตอาจจะไม่มีราคาเลยก็ได้(ไม่มีคอนโดสร้างใหม่ในปีนั้น) ทีนี้บริษัทอสังหาอยากทำmapออกมา เพือแรเงาราคาที่ดินหรือราคาเฉลี่ยคอนโดในแต่ละเขต
ปัญหาที่เจอคือ 1.ดาต้าเก็บไม่เท่ากันในแต่ละปี 2.ในแต่ละปีเองก็เก็บราคาคนละเดือน(ทีมสำรวจค่อยๆไล่ไปทีละเขต กว่าจะครบทุกเขต ปาไปครึ่งปี เช่นเขตฝั่งธนดาต้าเป็นเดือนมกรา แต่ฝั่งบางนากลายเป็นมิถุนา)
3.ดาต้าที่มีเก็บมาเป็นสิบปี สำรวจเป็นรอบๆ รอบนึงก็excel fileนึง
คำถาม
ข้อ1. ในฐานะที่เป็นทีมดาต้า จะมีไอเดียในการแก้ไขปัญหาเรื่องดาต้าอย่างไร และจะสามารถทำvisualization mapออกมาได้หรือไม่ ลองคิดดูครับ คำถามปลายเปิด ไม่มีถูกหรือผิด
สิ่งที่ต้องเข้าใจคือลักษณะข้อมูลที่จะได้รับมาจากทีมสำรวจ และปัญหาที่เจอ เพื่อจะได้แก้ไขปัญหาได้ตรงจุด
2. ดาต้าที่ได้มานั้นมีโอกาสเจอปัญหาอะไรได้บ้าง
ยกตัวอย่างไอเดียที่ไม่ถูกต้องมากนัก(จากทีมไฟแนนซ์เสนอมา)ว่าก็แต่ละพี้นที่จะมีราคาเฉลี่ยที่ดินในแต่ละปี ก็ดูว่าที่ดินนั้นมีอัตราการเติบโตของราคาเท่าไรในแต่ละปี ประเด็นคือไม่ใช่ทุกเขตมีราคากลาง และราคากลางมันกว้างไป(เขตวัฒนา มีตั้งแต่สถานีอ่อนนุชตอนบน ไปถึงสี่แยกอโศก ราคาแตกต่างกันชัดเจนแน่นนอน)
ข้อ2. Googleเวลาเสิชคำอะไรก็ตาม มันจะมีalgorithm robotในการคำนวนscoreของแต่ละเวปออกมา แล้วเรียงลำดับจากบนลงล่าง (ไม่นับที่จ่ายเงินอยู่บนสุดนะ) เพื่อให้คนที่ใช้Googleเจอเวปไซด์ที่ต้องการ
เพราะGoogleไม่อยากให้ลูกค้าหนีหาย(serchเจอแต่บ้าไรไม่รู้ ก็ย้ายเวปsearchสิ)
ทีนี้ให้ลองคิดดูครับว่า algorithmของGoogle มันใช้อะไรบ้าง(ยกตัวอย่างนะ เช่น คำว่า "ดูบอลสด"
แน่นอน video ต้องมี เวปไหนมี video จะได้คะแนนเพิ่ม ไรแบบนี้) Googleใช้เยอะมากเกิน100-200ตัวแปร
ลองคิดเล่นๆดู มีเยอะมากๆเลย ใบ้ให้คือเราต้องมองให้ออกว่าอะไรบ้างที่จะทำให้เลิกใช้Google หรือกลับมาใช้Googleอีก เหมือนที่บอกไปเช่นvideo