สายงานข้อมูล (Data)

📍 ในปัจจุบันนี้จะเห็นได้ว่าแทบทุก ๆ การกระทำของเรานั้น ถูกเก็บบันทึกเป็นข้อมูลไปหมด ไม่ว่าจะเป็น การซื้อของ การนั่งรถไฟฟ้า หรือการสั่งอาหารและการช็อปปิ้งออนไลน์ ข้อมูลเหล่านั้นถูกเก็บไปเพื่อที่องค์กรต่างๆ จะนำข้อมูลเหล่านั้นมาเป็นตัวช่วยในการตัดสินใจ, ประเมินประสิทธิภาพ, พัฒนากระบวนการ และ เข้าใจลูกค้ามากยิ่งขึ้น

Data

ทำความรู้จักอาชีพสาย Data

📍 Data คืออะไร? ทำไมถึงสำคัญ?

Data คือ 'ข้อมูล' ที่จะทำให้เราสามารถนำมาใช้เพื่อการวิเคราะห์วางแผนการใช้ชีวิตได้อย่างมีประสิทธิภาพมากยิ่งขึ้น

Data ถือเป็น 'สินทรัพย์' อย่างหนึ่งที่สำคัญของบริษัท เพราะจะช่วยทำให้บริษัทสามารถ . . .

  1. ตัดสินใจ: ข้อมูลเป็นสิ่งพื้นฐานที่องค์กรใช้ในการตัดสินใจ ไม่ว่าจะเป็น การหาลูกค้าใหม่การผลิตสินค้าใหม่หรือการระดมทุน
  2. ประเมินประสิทธภาพ: องค์กรสามารถติดตามข้อมูลค่าสถิติต่างๆ เพื่อดูว่ากลยุทธ์ที่วางไว้เป็นไปตามเป้าหมายที่วางไว้หรือเปล่า
  3. พัฒนากระบวนการ: ข้อมูลช่วยทำให้เราเห็นได้ว่ากระบวนการไหนสิ้นเปลืองทรัพยากร เพื่อที่จะพัฒนาเพื่อให้ระบบมีประสิทธิภาพมากขึ้น
  4. เข้าใจลูกค้า: ถ้าไม่มีข้อมูล เราไม่สามารถรู้ได้เลยว่า ใครคือกลุ่มลูกค้าของเรา ลูกค้าชอบสินค้าของเราไหม ชอบหรือไม่ชอบเพราะเหตุผลอะไร

📍 สิ่งที่ควรรู้เกี่ยวกับสายงาน Data

1. Big Data

คือ อภิมหาข้อมูลที่ . . .

  • มีปริมาณมหาศาล
  • เปลี่ยนแปลงอย่างรวดเร็ว
  • มีหลายรูปแบบและมาจากหลายแห่ง
  • ยังไม่ผ่านการประมวลให้กลายเป็นรูปแบบที่สามารถสร้างประโยชน์ได้

ปัญหาที่องค์กรมักจะเจอกับการจัดการ Big Data คือ ได้มีการลงทุนกับการเก็บดาต้าไว้อย่างมหาศาล เพราะการบันทึกข้อมูลถังเก็บข้อมูลล้วนมีค่าใช้จ่าย แต่ไม่รู้จะนำข้อมูลดิบเหล่านั้นไปใช้ต่ออย่างไร

2. Data Mining

คือ กระบวนการวิเคราะห์แยกแยะ และระบุรูปแบบของข้อมูลที่อยู่ใน Big Data โดยใช้หลักการของ สถิติระบบฐานข้อมูล และ การเรียนรู้ของเครื่องจักร (Machine Learning) โดยการทำ Data Mining มีประกอบไปด้วยหลายเทคนิค เช่น

  1. Association Rule: ค้นหาและระบุความสัมพันธ์ที่เกิดซ้ำๆของของสองสิ่งในชุดข้อมูล ตัวอย่างเช่น คนที่ซื้อขนมปัง มักจะซื้อเนยพร้อมกัน
  2. Data Classification: การจัดจำแนกข้อมูลตาม หมวดหมู่ตามคุณสมบัติบางอย่างที่กำหนดเอาไว้ก่อน (Predefined Class Labels) ตัวอย่างเช่น ธนาคารแบ่งหมวดลูกค้าที่มากู้ออกเป็นกลุ่มเสี่ยงน้อย เสี่ยงกลาง และเสี่ยงสูง ตามอายุและรายได้
  3. Data Clustering: คล้ายๆ Data Classification ที่แบ่งข้อมูลที่มีลักษณะคล้ายกันออกเป็นกลุ่ม แตไม่มีการกำหนด Class Label เอาไว้ก่อน
  4. Data Visualization: การนำข้อมูลมาเปลี่ยนเป็นกราฟ แผนภูมิวีดีโอ หรือ Dashboard เพื่อแสดงให้เห็นอะไรบางอย่าง เช่น รูปแบบ หรือ ความผิดปกติโดยมีเครื่องมือที่นิยมใช้ ได้แก่ Excel, Power BI, Tableau เป็นต้น

3. Data Privacy

คือความปลอดภัยของข้อมูลต่างๆ เพราะ การรวบรวม จัดเก็บ ใช้หรือเผยแพร่ข้อมูล บางอย่างสามารถไปละเมิดสิทธิความเป็นส่วนตัวของลูกค้าได้ และเพื่อที่จะเป็นไปตามกฎหมายที่อยู่กรอบในการคุ้มครองข้อมูลส่วนบุคคลขององค์การรวมมือและพัฒนาทางเศรษฐกิจ (OECD) เช่น

  • เจ้าของข้อมูลต้องรับรู้หรือยินยอมในการเก็บรวบรวมข้อมูล
  • ข้อมูลที่เก็บรวบต้องเกี่ยวข้องกับวัตถุประสงค์ที่กำหนดขึ้น
  • จะต้องไม่มีการเปิดเผย เว้นแต่จะได้รับความยินยอมเป็นต้น

📍 หน้าที่รับผิดชอบ & ทักษะที่จำเป็น :

Data Analyst

1. นักวิเคราะห์ข้อมูล (Data Analyst) = Data Communication

คือ ผู้ที่นำ Data มาหา Insight ย่อยข้อมูล และสร้าง Dashboard หรือ Report ข้อมูลเพื่อให้นำมาใช้ต่อได้ในเชิงทางธุรกิจ เชิง Marketing หรืออื่นๆ เพื่อให้บริษัทได้กำไรสูงสุด, และลดค่าใช้จ่ายที่ไม่จำเป็น นักวิเคราะห์ข้อมูลจะสรุปข้อมูลที่ซับซ้อนให้เป็นข้อสรุปอย่างง่าย เป็นแผนภาพ Visualization เพื่อที่จะนำมาใช้ได้ตามบริษัทต้องการ สามารถทำงานได้ในบริษัทต่างๆ เช่น ด้านการเงิน, การตลาด, สุขภาพ และโรงงาน เป็นต้น

ทักษะที่จำเป็น :
- เข้าใจแนวคิดในด้านธุรกิจ (Business Domain)
- การทำวิเคราะ์และทำแผนภาพสรุป (Data Visualization)
- สามารถใช้เครื่องมือทางสถิติ เช่น SPSS, Microsoft Excel, Stata
- สามารใช้เครื่องมือวิเคราะห์และแสดงผลข้อมูล: Tableau, Power BI, Google Data Studio
- ใช้ภาษา เช่น SQL, Python, R ฯลฯ

Data Scientist

2. นักวิทยาศาสตร์ข้อมูล (Data Scientist) = Data Modeling

คือ "นักสถิติที่เขียน Code ได้" เป็นผู้ที่นำ ข้อมูลมาสร้างเป็นโมเดล เพื่อสร้างสิ่งที่เลียนแบบจากข้อมูลต่างๆ ที่ได้มา ออกมาหา Pattern ในการทำนายผลต่างๆ เช่น พยากรณ์อากาศ และพยากรณ์เทรนของตลาด เป็นต้น นักวิทยาศาสตร์ข้อมูลจะเก็บรวบรวม, แปลผล และนำเสนอข้อมูล เพื่อทำให้บริษัทสามารถตัดสินใจในเรื่องต่างๆ ได้อย่างมีประสิทธิภาพมากยิ่งขึ้น ซึ่งนักวิทยาศาสตร์ข้อมูลจะสามารถทำงานได้ทั้งในบริษัทต่างๆ เช่น สายไอที (IT), สุขภาพ, การตลาด, การเงิน และธุรกิจการค้า เป็นต้น

ทักษะที่จำเป็น :
- มีความรู้ด้านคณิตศาสตร์ เช่น สถิติ, สมการ, แคลคูลัส, พีชคณิต ฯลฯ
- ความรู้ด้าน Artificial Intelligent และ Machine Learning
- ใช้เทคโนโลยีเกี่ยวกับ Big Data เช่น Hadoop และ Spark
- ใช้ภาษา เช่น SQL, R, Python, Scala, Go ฯลฯ

Data Engineer

3. วิศวกรข้อมูล (Data Engineer) = Data Storage

คือ ผู้ที่มีหน้าที่เตรียมข้อมูล ต่อท่อลำเลียงข้อมูล สร้างที่เก็บข้อมูล เช่น ฐานข้อมูล (Database), คลังข้อมูล (Data Warehouse), ทะเลสาปข้อมูล (Data Lake) นำข้อมูลเอามาเข้ากระบวนการมาทำความสะอาด (Data Cleaning) และนำข้อมูลมาจัดเก็บเอาไว้ให้พร้อมที่จะนำไปใช้ได้

ทักษะที่จำเป็น :
- ความรู้ด้านการพัฒนาซอฟต์แวร์ (Software Engineering): SDLC
- ความรู้ด้านการจัดการ Database, Data Warehouse, Data Lake
- ความรู้ด้าน Machine Learning และ Cloud Computing
- ใช้เทคโนโลยีเกี่ยวกับ Big Data เช่น Hadoop, Kafka, Spark
- ใช้ภาษา เช่น SQL, Python, Unix ฯลฯ

About the Author

Leave a Comment

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *

thไทย