Big Data คืออะไร พาส่องทุกองค์ประกอบ ก้าวทันโลกยุคใหม่

Big Data คืออะไร พาส่องทุกองค์ประกอบ ก้าวทันโลกยุคใหม่

หลังจากที่ได้รู้จักว่า Data คืออะไร เราจะพบว่าข้อมูลที่มากมายบนโลกถ้ากระจัดกระจายอยู่คงจะยากต่อการนำมาใช้งานใช่ไหมหละ แล้วเพื่อน ๆ เคยได้ยินเกี่ยวกับ Big Data กันไหมนะ ในบทความนี้เราจะพาเพื่อน ๆ ไปรู้จักกับ Big Data ที่จะยกระดับให้ทุกคนก้าวทันธุรกิจในโลกยุคดิจิทัลและปูพื้นฐานให้เพื่อน ๆ เพื่อไปต่อยอดกับงานสายวิทยาศาสตร์ข้อมูลที่สำคัญไม่แพ้สกิลด้านโปรแกรมมิ่งเลยกับ Big Data คืออะไร พาส่องทุกองค์ประกอบ ก้าวทันโลกยุคใหม่

ทำความเข้าใจ Big Data คืออะไร?

Big Data คืออะไร

ก่อนอื่นที่เพื่อน ๆ ต้องทำความเข้าใจก่อนเลยคือ Big Data คืออะไร จะพูดให้เข้าใจกันง่าย ๆ เลย Big Data จะหมายถึงข้อมูลจำนวนมาก ๆ ที่ถูกเก็บรวบรวมและบันทึกไว้และมีความซับซ้อน ที่ผ่านขั้นตอนในการวิเคราะห์และประมวลผลที่มีประสิทธิภาพด้วยเทคโนโลยีและเครื่องมือต่าง ๆ หรือจะเรียกว่าบิ๊กดาต้าเป็นหนึ่งในเทคโนโลยี ที่สามารถบริหารจัดการได้ด้วยตัวมันเอง ซึ่งในปัจจุบัน Big Data มีบทบาทสำคัญมากในเชิงธุรกิจและองค์กร ทั้งในแง่ของการวางแผนและตัดสินใจ หรือใช้ข้อมูลเพื่อสร้างโอกาสทางธุรกิจได้มากขึ้น

จุดเริ่มต้นของ Big Data

Big Data คืออะไร ประวัติ Big Data

คำว่า Big Data เอาเข้าจริงถือว่าเป็นศัพท์ใหม่ที่เริ่มใช้ในช่วงปี 1990 เท่านั้นเองโดยมี John Maskey ทำให้รู้จักอย่างแพร่หลาย แต่เอาจริง ๆ แล้วข้อมูลขนาดใหญ่นี้ได้มีต้นกำเนิดริเริ่มตั้งแต่ช่วงยุค 60 และ 70 จากข้อมูลที่เติบโตและมีจำนวนมากขึ้นทุกวัน แล้วทำไมเราถึงพึ่งรู้จักกับ Big Data ได้ไม่นานหละ คำตอบก็ง่าย ๆ เลยเพราะว่าด้วยปัญหาด้านเทคโนโลยีในอดีตนั้นไม่ได้มีประสิทธิภาพพอที่จะรองรับข้อมูลขนาดใหญ่ได้ ทำให้ในปัจจุบันที่เทคโนโลยีพัฒนามาอย่างก้าวกระโดดทำให้ Big Data เป็นที่นิยมมากในปัจจุบันจนถึงในปี 2018 ได้มีการนิยามให้กับข้อมูลขนาดใหญ่ใหม่ว่า “เครื่องมือในการจัดการกับข้อมูล”

5V 1C คุณลักษณะสำคัญสู่การเป็น Big Data

Big Data คืออะไร 5V 1C

การที่จะบอกได้ว่าข้อมูลเหล่านี้เป็น Big Data หรือไม่เพื่อน ๆ จะต้องรู้จักกับคุณลักษณะทั้ง 6 ของข้อมูลขนาดใหญ่ที่เราจะเรียกว่า 5V + 1C โดยคุณลักษณะทั้ง 6 มีดังนี้

ข้อมูลจำนวนมาก (Volume)

ปริมาณข้อมูลใน Big Data นั้นต้องมีปริมาณมากและเพิ่มจำนวนขึ้นอย่างรวดเร็ว มีขนาดที่ใหญ่ทำให้ระบบจัดการข้อมูลแบบทั่วไปรองรับไม่ไหว เช่นจำนวน Transection ซื้อขายบนเว็บไซต์ E-commerce จึงทำให้เป็นคุณลักษณะที่สำคัญของข้อมูลขนาดใหญ่

ความเร็ว (Verocity)

อัตราการสร้างและกระจายตัวของข้อมูลที่รวดเร็วและต่อเนื่องโดยใน Big Data ข้อมูลจะได้มาแบบเรียลไทม์ทำให้มีการประมวลผลอยู่ตลอดและความถี่ในการ บันทึก, ประมวลผลและเผยแพร่ข้อมูลที่มากกว่าข้อมูลขนาดเล็ก เช่น ระบบการแสกนบัตรเข้าออกอาคารสำนักงานที่จะมีการเก็บข้อมูลทั้งเจ้าของบัตร เวลาเข้า-ออก และอื่น ๆ แบบเรียลไทม์ ซึ่งเรียกได้ว่าเป็นข้อมูลที่มีปริมาณมากและมีความเคลื่อนไหวอยู่ตลอด

ความหลากหลายของข้อมูล (Variety)

รูปแบบของข้อมูลใน Big Data จะต้องมีความหลากหลายไม่ว่าจะเป็นข้อมูลแบบมีโครงหรือกึ่งโครงสร้าง ทั้งในด้านประเภทของข้อมูลหรือแหล่งที่มาของข้อมูล ข้อมูลข้อความ ภาพและเสียง หรือข้อมูลประเภทอื่น ๆ ก็สามารถที่จะอยู่ในข้อมูลขนาดใหญ่ไดเ เพื่อจะนำไปวิเคราะห์ต่อยอดได้อย่างมีประสิทธิภาพ

ความถูกต้องของข้อมูล (Veracity)

ความถูกต้องและความน่าเชื่อถือของข้อมูลเป็นสิ่งที่สำคัญ เพราะว่าใน Big Data นั้นมีข้อมูลจำนวนมหาศาลที่เรารวบรวมมาจากหลากหลายแหล่ง จึงเป็นไปได้สูงที่จะเกิดความผิดพลาดจึงจำเป็นต้องใส่ใจความถูกต้องและตรวจสอบแหล่งที่มาให้ดี รวมถึงการจัดการข้อมูลดิบที่ได้รับมาอย่างเช่นการทำ Data Cleansing เพื่อให้ข้อมูลมีความถูกต้องและน่าเชื่อถือมากที่สุด

คุณค่าของข้อมูล (Value)

ข้อมูลที่ได้มาจะต้องนำไปใช้ให้เกิดประโยชน์หรือสร้างมูลค่าเพิ่มได้ โดยการนำข้อมูลที่ได้มาเข้าสู่กระบวนการวิเคราะห์เพื่อหา Insight และสร้างประโยชน์ต่อธุรกิจหรือองค์กรได้อย่างมีประสิทธิภาพสูงสุด

ความเชื่อมโยงกันของข้อมูล (Complexity)

การจะใช้ Big Data ให้เกิดประสิทธิภาพสูงสุดนั้น ข้อมูลภายในจำเป็นต้องมีความเชื่อมโยงกันถ้าข้อมูลที่เราเก็บรวบรวมมากระจัดกระจายและหาจุดเชื่อมโยงกันไม่ได้แล้วการนำมาวิเคราะห์ประมวลผลก็อาจจะไม่ได้ผลลัพธ์ที่ตรงกับวัตถุประสงค์ของเรา แล้วเราก็คงไม่รู้ว่าจะเอาข้อมูลเหล่านั้นไปทำอะไร

Big Data Ecosystem

Big Data คืออะไร Ecosystem

Big Data Ecosystem ถือเป็นองค์ประกอบที่แสดงภาพใหญ่ในการทำงานของ Big Data ตั้งแต่การเก็บรวบรมข้อมูล นำขอมูลที่ได้มาประมวลผลและวิเคราะห์ จนถึงการนำเข้ามูลไปใช้งาน หรือจะเรียกว่าเป็นวงจรชีวิตของ Big Data ก็ว่าได้ ซึ่งองค์ประกอบเหล่านี้แบ่งออกเป็น 3 ส่วนใหญ่ ๆ คือ การรวบรวมและจัดเก็บข้อมูล (Stroage) การประมวลผลข้อมูล (Processing) และ การวิเคราะห์ข่อมูลและการนำไปใช้ประโยชน์ (Analyst and Application) โดยมี 5 องค์ประกอบหลัก ๆ ใน Big Data Ecosystem ดังนี้

การเก็บข้อมูล (Data Ingestion)

ในส่วนของการรวบรวมและการจัดเก็บข้อมูลถือเป็นจุดเริ่มต้นทั้งหมดของ Big Data เริ่มจากกระบวนการในการเก็บข้อมูลดิบจากแหล่งข้อมูลต่าง ๆ ทั้งแหล่งข้อมูลภายใน (Internal sources) ฐานข้อมูลเชิงสัมพันธ์ (Relational databases) และ ฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์ (Non-relational database) รวมถึงแหล่งอื่น ๆ ที่มีอยู่มากมายบนโลกโดยแบ่งการนำเข้าเป็น 2 ประเภทหลัก ๆ

  1. Batch คือการรวบรวมข้อมูลรวมถึงการส่งผ่านกลุ่มข้อมูลขนาดใหญ่ ไปด้วยกันผ่านการตั้งเงื่อนไขในการเรียกใช้งาน เช่นการตั้งเวลาหริอการตั้งค่าปุ่มเพื่อเรียกใช้
  2. Streaming คือการนำเข้าข้อมูลอย่างต่อเนื่อง ซึ่งเหมาะสมกับการนำไปวิเคราะห์ข้อมูลแบบเรียลไทม์มาก ๆ

ระบบจัดเก็บข้อมูล (Data Storage Systems)

การจัดเก็บข้อมูล เป็นการรวบรวมข้อมูลจากที่รวบรวมและผ่านการจัดการข้อมูล มาพักไว้เพื่อรอนำไปใช้งานในการวิเคราะห์ต่อไป ในปัจจุบันมักถูกเก็บอยู่ในรูปแบบของคลังข้อมูล (Data Warehouse)

การวิเคราะห์ข้อมูล (Data Analysis)

ส่วนที่สำคัญมาก ๆ สำหรับ Big Data ในความคิดของเราเพราะเป็นส่วนที่จะทำให้จุดประสงค์หลังในการรวบรวมข้อมูลของเราประสบความสำเร็จมากที่สุด มักจะเป็นหน้าที่ของ Data Scientist ที่จะวิเคราะห์ข้อมูลเบื้องต้นด้วยหลักสถิติ หรือการสร้างโมเดลเพื่อการวิเคราะห์เชิงลึกหรือใช้ Machine Learning เพื่อตอบโจทย์ในแต่ละปัญหาที่ต้องการพัฒนาผ่าน Algorithm มากมายเช่นการทำ Recommendation System เพื่อแนะนำสินค้า หรือการแบ่ง Cluster ไซส์เสื้อผ้าเพื่อวิเคราะห์ว่าฐานลูกค้าใส่เสื้อผ้าแ่ละไซส์มีจำนวนเท่าไหร่ เพื่อหาแนวทางในการพัฒนาตามวัตถุประสงค์ต่อไปได้ ซึ่งในการวิเคราะห์ข้อมูลต้องอาศัยการทำซ้ำเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

การนำเสนอแผนภาพข้อมูล (Data Visualization)

หลังจากทำการวิเคราะห์ข้อมูลเรียบร้อยแล้วการนำข้อมูลที่ได้จากการวิเคราะห์มาแสดงผลในรูปแบบกราฟฟิกต่าง ๆ อย่างกราฟเชิงสถิต เช่น Boxplot, Scatter plot หรือ Pie Chart ก็สำคัญไม่แพ้กันเพราะในความเป็นจริงข้อมูลชุดนึงไม่ได้ถูกใช้เพียงคนเดียวหรือทีมงานทีมเดียวเท่านั้น แต่ยังต้องมีการนำข้อมูลไปใช้ในหลาย ๆ ฝ่ายการนำเสนอข้อมูลในรูปแบบแผนภูมิจะช่วยให้ง่ายต่อการนำไปใช้งานต่อและคนที่ต้องใช้สามารถดูแล้วเข้าใจได้เลย

การนำข้อมูลไปใช้ประโยชน์ (Application)

หลังจากผ่านกระบวนการทั้งหมด เราจะได้ผลลัพธ์ที่จะสามารถนำมาใช้งานได้ทั้งในรูปแบบของ Visualization เพื่อให้ Data Analyst นำผลลัพธ์ไปใช้วิเคราะห์เพื่อหาแนวโน้มทางธุรกิจ หรือทีมการตลาดนำไปใช้ประกอบกับการดำเนินแผนทางการตลาด หรือจะนำไปใช้ในรูปแบบของ API ในองค์กรเพื่อให้ User สามารถเข้าถึงข้อมูลได้ด้วยตนเองก็ย่อมได้

ธุรกิจกับ Big Data

อย่างที่เราได้บอกไปตั้งแต่ต้นว่า Big Data ถูกนำไปใช้กับธรุกิจอย่างแพร่หลายในปัจจุบัน ไม่ว่าจะเป็นธุรกิจห้างร้านและการทำการตลาด ด้านสุขภาพ การท่องเที่ยวและคมนาคมจนไปถึงธุรกิจบันเทิง ซึ่งข้อมูลไม่เพียงแต่ถูกนำไปใช้แต่ยังเป็นสิ่งที่มีคุณค่าต่อการพัฒนาธุรกิจให้ดำเนินงานได้อยากมีประสิทธิภาพมากที่สุด ต่อไปเราจะพาไปดูตัวอย่างการนำ Big Data ไปใช้ในธุรกิจชั้นนำของโลกว่าพวกเขาประยุกต์ใช้ข้อมูลยังไง เพื่อเป็นไอเดียให้เพื่อน ๆ กันนะ

Big Data คืออะไร ธุริกิจที่นำ Big Data มาใช้

Google

หนึ่งในธุรกิจที่ใกล้ตัวเราทุกคนมากที่สุดอย่าง Google เป็นตัวอย่างการนำ Big Data มาใช้งานที่โดดเด่นและหลากหลายที่สุดเลยก็ว่าได้ ซึ่งเราเชื่อเลยว่า Google แทรกอยู่ในแทบจะทุกอริยาบทไม่ว่าจะการค้นหาข้อมูล การเดินทางด้วย Google Map หรือดูวิดิโอใน Youtube ซึ่งทั้งหมดนี้ล้วนประกอบด้วย Big Data ในหลากหลายรูปแบบมาใช้ประโยชน์อย่างการใช้บอทในการ Crawling เพื่อรวบรวมข้อมูลเว็บไซต์และ ทำการ Indexing เพื่อหาดัชนีจัดอันดับเว็บไซต์ตามคำค้นหา แต่ว่าไม่เพียงแต่จะแสดงผลตามคำค้นหาเท่านั้น แต่ Google ยังแสดงผลลัพธ์โดยยึดจากข้อมูลของผู้ใช้ ไม่ว่าจะเป็นประวัติการท่องเว็บและการค้นหา พื้นที่ของผู้ใช้ ซึ่งถือว่าเป็นการใช้ Big Data เพื่อมอบประสบการณ์ใช้งานที่ดีที่สุดให้กับผู้ใช้นั้นเอง

Streaming

ธุรกิจบันเทิงเป็นอีกธุรกิจที่นำ Big Data มาใช้อย่างแพร่หลายหนึ่งในนั้นคือระบบ Streaming ไม่ว่าจะเป็นการดูหนังฟังเพลง อย่าง Netflix, Spotify หรืออื่น ๆ ที่มีข้อมูลของผู้ใช้จำนวนมากอยู่ในมือ ทั้งข้อมูลทั่วไป แนวที่ชอบจากผู้ใช้ทั่วโลก และได้นำข้อมูลเหล่านี้ มาประกอบการใช้ระบบแนะนำ (Recommendation System) ตามพฤติกรรมการรับชมของผู้ใช้ เพื่อนำมาสร้างโปรแกรมแนะนำหนังหรือเพลที่ใกล้เคียงกันในหน้าหลัก หรือการเก็บข้อมูลแนวที่ชอบและแนะนำในแนวที่ผู้ใช้ชื่นชอบได้อย่างตรง ทั้งยังสามารถนำไปพัฒนาต่อยอดในการซื้อลิขสิทธิ์หนังหรือเพลงเข้ามาใน Platform ของตัวเองให้ตรงใช้ผู้ใช้มากยิ่งขึ้น

Starbuck

เพื่อน ๆ สงสัยกันไหมว่าทำไม Starbucks ถึงมีสาขามากมายในบริเวณเดียวกัน แล้วคนก็ยังเยอะแบบไปกี่ครั้งก็ไม่มีที่นั่ง เราจะบอกว่าทั้งหมดไม่ใช่เพียงเพราะว่าภาพลักษณ์แบรนด์ี่เป็นที่รู้จักเพียงเท่านั้น แต่ Starbucks ในการเปิดสาขาใหม่ได้มีการวิเคราะห์ด้วย Big Data ในการวิเคราะห์ข้อมูลอย่างถี่ถ้วนก่อนจะเปิดสาขาใหม่ยังไงหละ

วิธีการที่ Starbucks ใช้นั้นคือการเก็บรวบรวมข้อมูลต่าง ๆ ทั้งสถานที่ การจราจรหรือข้อมูลประชากรในแต่ละพื่นที่ที่สนใจ แล้วข้อมูลพวกนี้ไปเอามาจากไหนหละ จริง ๆ แล้วการรวบรวมจากแหล่งข้อมูลภายนอกก็เป็นไปได้ แต่แหล่งข้อมูลที่สำคัญจะเป็นที่ไหนไปได้นอกจากร้านสาขาของ Starbucks เองนั้นแหละ จำนวนลูกค้าในสาขาเหมาะสมกับพื้นที่ไหม ยอดขายในแต่ละวัน ถ้ามากและเกินกว่าพื้นที่จะรับไหวการเปิดสาขาเพิ่มจะเป็นอะไรไป รวมถึงข้อมูลเหล่านี้ ยังสามารถนำมาพัฒนาต่อยอดทางธุรกิจ สร้างโปรโมชั่นให้เหมาะสม เพื่อที่จะเพิ่มผลกำไรได้อีกด้วย

Big Data คืออะไร สรุป

ทั้งหมดที่เราจะให้เพื่อน ๆ ได้กับบทความ Big Data คืออะไร พาส่องทุกองค์ประกอบ ก้าวทันโลกยุคใหม่มีเพียงเท่านี้ ซึ่งเราเชื่อว่าจะเพียงพอให้ทุกคนเข้าใจหลักใหญ่ใจความของ Big Data ได้และถือว่าเป็นการปูพรมแดงสู่การใช้งาน Data ได้อย่างชำนาญเลยหละ เราสนับสนุนให้เพื่อน ๆ ศึกษาเกี่ยวกับข้อมูลไว้เยอะ ๆ นะ เพราะถ้าเราเชียวชาญการใช้ข้อมูล ไม่ว่าจะทำอะไรก็แล้วแต่ก็จะสามารถทำได้อย่างมีประสิทธิภาพมากขึ้น สำหรับวันนี้ดีใจที่ได้มาแชร์ความรู้ให้ทุกคน สวัสดีนะ

Verified by MonsterInsights