วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Data Management (Cont’d) and Business Intelligent

Data Management

Major Benefits of Data Warehouses
1. ข้อมูลรวดเร็ว ทันต่อการใช้งาน
2. ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายขึ้น

Data warehouse เหมาะสำหรับองค์กรที่มีลักษณะดังนี้
  • ข้อมูลจำนวนมาก
  • ข้อมูลถูกเก็บไว้ในหลายระบบ
  • มีการบริหารโดยวิธีที่อาศัยข้อมูลเป็นพื้นฐาน
  • มีฐานลูกค้าที่ใหญ่และหลากหลาย
  • ข้อมูลเดียวกันถูกนำเสนอแตกต่างกันในระบบที่แตกต่างกัน
  • ข้อมูลถูกเก็บอยู่ในรูปแบบทางเทคนิค ยากที่จะถอดรหัส
  • มีการคำนวณอย่างกว้างขวาง
Data warehouse process
นำข้อมูลที่ได้จากปฎิบัติงานภายในหรือข้อมูลภายนอกมาเข้าสู่ขั้นตอน Data staging หรือ ETL คือ Extract และ Clean จากนั้นก็ Transform ห้อยู่ในรูปแบบที่นำไปใช้ประโยชน์ได้ แล้วจึง Load ข้อมูลที่ได้จากการแปลงลง Data cube จากนั้นเก็บข้อมูลใน Data Warehouses และจึงจะสามารถนำมาใช้ในหัวข้อต่างๆทางธุรกิจ โดยสามารถนำเสนอผลที่ได้จากการวิเคราะห์ข้อมูลในรูปแบบต่างๆ เพื่อทำการตัดสินใจต่อไป เช่นใช้ Dashboard เป็นต้น

Metadata
เป็นข้อมูลที่เกี่ยวกับข้อมูล ซึ่งจะข้อมูลสารสนเทศเกี่ยวกับเนื้อหาของคลังข้อมูล รวมถึงแนวทางการเคลื่อนย้ายข้อมูลไปยังคลังข้อมูล กฎสำหรับการสรุปข้อมูล ศัพท์ทางธุรกิจที่ใช้ในการอธิบายข้อมูล เทคโนโลยี และกฎในการคัดแยกข้อมูล เป็นต้น

The data mart
เป็นรูปแบบของคลังข้อมูลที่ขนาดเล็กลง (a small scaled-down version of a data warehouse) ออกแบบมาเพื่อใช้ในหน่วยธุรกิจเชิงกลยุทธ์ (SBU) หรือแผนก และเนื่องจากมีข้อมูลน้อยกว่าคลังข้อมูล จึงสามารถตอบสนองได้อย่างรวดเร็วและสามารถค้นหาตำแหน่งได้ง่ายกว่าคลังข้อมูล
โดย Data marts มี 2 ชนิด คือ
1.       Replicated data mart - เป็นส่วนย่อยขนาดเล็กของคลังข้อมูล โดยการทำงานคือจะคัดลอกข้อมูลส่วนย่อยของคลังข้อมูลมาไว้ใน Data marts ที่มีขนาดเล็กกว่า
2.       Stand-alone data marts - เป็น Data marts อิสระแบบไม่อาศัยคลังข้อมูล อาจจะเกิดจากการที่องค์กรยังมีพร้อมที่จะมีคลังข้อมูล ดังนั้นฝ่ายต่างๆ เช่นฝ่ายการตลาด การเงิน จึงสร้าง Data marts ของตวเอง ซึ่ง Data marts ชนิดนี้จะยากที่จะนำมารวมเป็นคลังข้อมูลในภายหลัง
The data cube OR Multidimensional Databases
คือฐานข้อมูลที่มีหลายมิติ หรือเรียกว่า OLAP ซึ่งเป็นที่เก็บข้อมูลที่จัดข้อมูลในมิติต่างๆ ซึ่งถูก Transform แล้วจึงมา Load ลงไว้ที่นี่ เพื่อให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น เช่น พื้นที่การขาย ชนิดของสินค้า ภูมิภาคของร้านค้า จำนวนพนักงายขาย ซึ่ง จุดเด่นของ Data Cube คือ สามารถตัดแบ่งส่วนเพื่อเลือกข้อมูลที่ต้องการวิเคราะห์ได้ ทำให้สามารถวิเคราะห์ข้อมูลที่มีได้ในหลายมิติ หลายมุมมอง ทำให้เห็นปัญหาที่ชัดเจนขึ้นโดยใช้วิธี Slices and Dices

-------------------------------------------------------------------------------------------------------------------------

Business Intelligence
Business Intelligent ไม่ใช่ระบบสารสนเทศแต่เป็นเครื่องมือในการวิเคราะห์ข้อมูล โดยมีการรวบรวมเครื่องมือ ฐานข้อมูล โปรแกรมคอมพิวเตอร์ และระเบียบวิธีเข้าด้วยกัน เพื่อให้เกิดการเข้าถึงข้อมูลเชิงโต้ตอบ จัดการข้อมูล และการวิเคราะห์ข้อมูลที่เหมาะสมสำหรับผู้บริหารและนักวิเคราะห์ ด้วยกระบวนการแปลงข้อมูลเป็นสารสนเทศ จากนั้นก็นำไปสู่การตัดสินใจ และสู่การปฏิบัติจริงต่อไป (ซึ่งการใช้ Business Intelligent ไม่จำเป็นที่จะต้องมี Data Warehouses จะใช้ Database แทนได้)

ประกอบด้วย 3ส่วนหลัก คือ
1.Reporting and analysis
Enterprise Reporting System 
จัดทำรายงานทั้งในรูปแบบปกติ และรูปแบบที่สามารถปรับแก้ได้ตามความต้องการ ซึ่งรายงานเหล่านี้จะเป็นข้อมูลที่เตรียมให้สำหรับผู้บริหารนำไปใช้ในการวิเคราะห์
Balance Scorecard (BSC)
เป็นทั้งเครื่องมือวัดผลการดำเนินงานในมุมมองต่างๆ สามารถแสดงความคืบหน้า เปรียบเทียบผลที่ได้จริงกับเป้าหมายที่วางไว้ และยังเป็นระเบียบวิธีการบริหาร ที่จะช่วยแปลการเงิน ลูกค้า กระบวนการภายใน และการเรียนรู้ของอค์กรออกมาในรูปแบบของการดำเนินการในทางปฏิบัติ และยังเป็นการทำให้การปฎิบัติงานขององค์กรสอดคล้องกับกลยุทธ์องค์กรโดยรวมด้วย โดยการใช้ KPI Dashboard ต้องมี KPI เสมอ ตัวอย่าง KPI เช่น Cost per Sale ,Sales per Download ,Revenue per Sale, Profit per Sale
Dashboard
โดยทั่วไปเป็นการปฎิบัติและกลวิธีในการใช้งาน เป็นตัวนำเสนอออกมาเป็นรูปภาพในการติดตามผลการดำเนินงานในการปฏิบัติการ สามารถแบ่งเป็น 3 ประเภท ได้แก่
1. Operational dashboards
2. Tactical dashboards
3. Strategic dashboards
2.Analytic
Online Analytical Processing (OLTP)
เป็นเครื่องมือเริ่มต้นของผู้บริหารที่ช่วยในการวิเคราะห์ โดยจะช่วยระบุปัญหาและวิเคราะห์ได้ในพื้นฐานเท่านั้น ซึ่งการวิเคราะห์ข้อมูลด้วยเครื่องมือนี้จะทำให้ได้ insight ของข้อมูล แสดงผลออกมาในรูปแบบของกราฟ
Mining
เป็นการนำข้อมูลที่ยังไม่รู้ขึ้นมาให้รู้โดยแบ่งเป็น 3ประเภทคือ
2.1.Data Mining –เป็นการค้นหาข้อมูลที่มีโครงสร้างซึ่งข้อมูลที่จะนำมาใช้ต้องมีจำนวนมาก โดยแบ่งผลออกเป็น5ประเภทคือ
1. Clustering – นำเสนอข้อมูลโดยให้ข้อมูลจัดกลุ่มโดยไม่กำหนดกลุ่มให้กับข้อมูลตั้งแต่ต้นแต่
2. Classification – นำเสนอข้อมูลตามทที่ได้ตั้งสมมติฐานไว้ตั้งแต่ต้น
3.Association - นำเสนอผลสืบเนื่อง
4.Sequence discovery – ผลที่เกิดตามหลังมา
5.Prediction – นำเสนอโดยการพยากรณ์สิ่งที่จะเกิดขึ้น
2.2.Text Mining -เป็นการจัดกระทำกับข้อมูลที่ไม่มีรูปแบบ (Unstructure Data) เช่น ความคิดเห็นของลูกค้า โดยจะช่วยในการหา hidden content จากข้อมูลที่ไม่มีรูปแบบ และจัดกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน
2.3. Web mining
3.Data Integration

วันพุธที่ 12 มกราคม พ.ศ. 2554

WEEK 8 : Data Mgt

ระบบ (System) ประกอบไปด้วย input, process, output เป็นหลักๆ และเสริมด้วย environment, boundary, control - feedback และ subsystem ก่อนอื่นเราจะต้องมีวัตถุประสงค์ก่อนว่าอะไรคือ output ที่ต้องการเห็น เพื่อจะได้สามารถระบุ input และ process ได้ชัดเจนต่อไป

Data and Information
          สาร (Message) สามารถเป็นได้ทั้ง Data และ Information แต่จะเป็นอะไรนั้นขึ้นกับผู้รับสารนั้นๆ ถ้าผู้รับสารได้ประโยชน์หรือเกิดการเปลี่ยนพฤติกรรมจากสารนั้น สารนั้นก็จะเป็น information (แต่ไม่เกี่ยวกับการผ่านกระวนการแล้วหรือไม่เนื่องจากสารบางอย่างผ่านกระบวนการแล้วก็ยังมีหน้าตาไม่ต่างจากเดิม)

Information system
          ระบบสารสนเทศ คือ ระบบที่ประกอบด้วยการเก็บ รวบรวมข้อมูล และวิเคราะห์ข้อมูลเหล่านั้น เพื่อได้มาซึ่งสารสนเทศที่ต้องการตามวัตถุประสงค์ของผู้ใช้งาน (ถือเป็นoutput) รวมถึงมีการถ่ายทอด นำเสนอข้อมูลเหล่านั้นแก่ผู้มีสิทธิใช้สารสนเทศ และต้องทำการจัดเก็บข้อมูลเพื่อใช้ในอนาคตต่อไป
            ดังนั้นจึงมีตัวอย่าง Web ที่เป็น IS ก็เช่น Amazon.com ทั้งนี้เพราะเป็น E-commerce มีการสั่งของเป็น input กระบวนการภายในของ Amazon เป็น process และมี output คือ ของที่สั่ง

องค์ประกอบของสารสนเทศ
1.    Hardware
2.     Software
3.     Data
4.     Network
5.     Procedure
6.     People

Data Management

การบริหารข้อมูลทำได้ยาก เพราะ
  1. มีข้อมูลเพิ่มขึ้นจำนวนมากตลอดเวลา
  2. ข้อมูลกระจัดกระจายอยู่ตามหน่วยงานต่างๆ 
  3. ข้อมูลมีความซ้ำซ้อน เมื่อแต่ละฝ่ายมีการสร้างและเก็บแยกจากกัน
  4. ข้อมูลจากภายนอกที่ใช้ในการตัดสินใจเป็นข้อมูลที่เราไม่ได้เป็นเจ้าของ จึงไม่สามารถทำอะไรได้
  5. มีเรื่องความปลอดภัยของข้อมูล คุณภาพ และ จริยธรรมที่เป็นประเด็นสำคัญ
  6. การเลือกเครื่องมือเพื่อใช้ในการจัดการ
วัตถุประสงค์คือการจัดทำโครงสร้างพื้นฐานเพื่อแปลงข้อมูลดิบเป็นสารสนเทศขององค์กรมีพื้นฐานดังนี้
1.      Data profiling ข้อมูลเบื้องต้นของข้อมูลที่จัดเก็บ
2.      Data quality management เพื่อการปรับปรุงคุณภาพของข้อมูล
3.      Data integration เป็นการรวบรวมข้อมูลที่เหมือนกันจากหลายแหล่งเข้าด้วยกัน
4.      Data augmentation เพื่อเพิ่มคุณค่าของข้อมูล

Data Life Cycle Process แบ่งออกเป็น 4 ขั้นตอน ดังนี้
1.       เก็บรวบรวมข้อมูลจาก3 แหล่งคือ Internal Data, External Data และ Personal Data
2.       เก็บข้อมูลใน database และปรับเปลี่ยนรูปแบบ(format)ของข้อมูลเข้าสู่ data warehouse
3.       คัดลอกข้อมูลเพื่อการวิเคราะห์ต่อไป
4.       การวิเคราะห์ใช้เครื่องมือ เช่น Data analysis tools และ Data mining tools

Data Processing แบ่งได้เป็น 2 ประเภท
1.      Transactional เป็นระบบปฏิบัติการ (Operational systems) ใช้ TPS จัดเก็บข้อมูลและแปลผลจากส่วนกลาง
2.      Analytical เป็นการเอาข้อมูลมาใช้ประมวลผลอีกครั้งเพื่อการตัดสินใจระดับสูงขึ้นไป นำข้อมูลเหล่านี้ไปใช้วิเคราะห์ต่อ

Data Warehouse การทำ Data Warehouse นั้นเป็นเหมือนขั้นตอนการเตรียมข้อมูลเฉพาะที่ต้องการ เพื่อนำไปใช้ในการวิเคราะห์และประมวลผลเพื่อการตัดสินใจอีก ซึ่งจะเหมาะกับองค์กรที่ผู้บริหารเน้นการใช้ข้อมูลในวิเคราะห์ตัดสินใจ ดังนั้น ไม่ใช่ทุกองค์กรที่จะต้องทำ Data Warehouse

ประโยชน์ของ Data Warehouse
1.      เข้าถึงข้อมูลได้เร็ว
2.      เข้าถึงข้อมูลได้ง่าย

Characteristics of Data Warehouses
1.               Organization by subject  มีการจดหมวดหมู่ของข้อมูลใหม่ โดยจัดตามสิ่งที่สนใจ (Subject) เป็นหลัก
2.               Consistency เก็บข้อมูลให้อยู่ในรูปแบบเดียวกัน อย่างความสม่ำเสมอฃ
3.               Time variant มีช่วงเวลาที่ชัดเจน
4.               Non-volatile ข้อมูลจะไม่มีการเปลี่ยนแปลงอีก คือไม่ update แต่จะ refresh อยู่เสมอ
5.               Relational
6.               Client/server ใช้ server ให้ผู้ใช้gข้าถึงข้อมูลได้ง่าย

องค์กรที่เหมาะกับการใช้ Data Warehouse
  1. มีข้อมูลจำนวนมากที่ผู้ใช้ต้องการเข้าถึง
  2. ข้อมูลระดับ operational ถูกจัดเก็บไว้ในหลากหลายรูปแบบ หลากหลายระบบ
  3. มีการใช้ข้อมูลเป็นปัจจัยสำคัญในการตัดสินใจ
  4. มีลูกค้าหลากหลายแบบ
  5. ข้อมูลเดียวกันถูกเก็บในหลายรูปแบบในหลายระบบ
  6. ข้อมูลถูกเก็บในระบบและรูปแบบที่ยากต่อการเข้าใจและแปลความ