Friday, June 12, 2015

8:32 PM Posted by Nana

Tuesday, June 9, 2015

องค์ประกอบของคลังข้อมูล

8:00 PM Posted by Nana
คลังข้อมูลอาจจะมีข้อมูลเป็นจํานวนมากมายมหาศาล ดังนั้นจึงจําเป็นต้องมีฐานข้อมูลของตนเองในการเก็บและประมวลผลข้อมูล หน่วยงานต้องมีโปรแกรมจัดการฐานข้อมูลและโปรแกรมอื่นๆ สําหรับช่วยในการเปลี่ยนรูปแบบข้อมูล จัดกลุ่มข้อมูล รวมข้อมูล และโยกย้ายข้อมูลจากฐานข้อมูลหนึ่งไปยังฐานอื่นๆ  โปรแกรมเหล่านี้ต้องทำงานได้ทั้งกับข้อมูลที่เป็นจํานวน ข้อมูลกราฟิก ข้อมูลภาพลักษ์ และ  ข้อมูลแบบมัลติมีเดียโปรแกรมเหล่านี้จะต้องสามารถแปลงข้อมูลให้เหมาะสมที่จะนําไปวิเคราะห์ และจัดทํารายงานในรูปแบบต่างๆ ได้


โดยที่คลังข้อมูลมีบริการสำคัญหลายอย่างให้แก่ผู้ใช้งานอาจจะไม่ใช่ผู้เชี่ยวชาญในด้านคอมพิวเตอร์ดังนั้นการจัดคลังข้อมูลจึงจำเป็นต้องจัดการฝึกอบรมให้แก่ผู้ใช้ด้วย นอกจากนั้นยังอาจจะต้องจัดระบบอธิบายการใช้เอาไว้ในระบบด้วยเพื่อให้ผู้ใช้สามารถเรียกคําอธิบายมาใช้เมื่อต้องการได้  ส่วนประกอบสำคัญอีกอย่างหนึ่งก็คือที่ปรึกษาเกี่ยวกับคลังข้อมูลเพื่อช่วยเหลือผู้ใช้ให้สามารถใช้ระบบได้อย่างมีประสิทธิภาพมากขึ้น

ส่วนประกอบของคลังข้อมูลมีดังนี้
1. เครื่องมือสกัดแยกข้อมูล
2. ข้อมูลที่สกัดและแยกออกมาแล้ว
3. เมตาเดตา (Meta-Data) สําหรับบรรยายเนื้อหาข้อมูล
4. ฐานข้อมูลสําหรับคลังข้อมูล
5. เครื่องมือจัดการข้อมูลในคลังข้อมูล
6. โปรแกรมสําหรับจัดส่งข้อมูล
7. เครื่องมือวิเคราะห์สําหรับผู้ใช้
8. วัสดุและหลักสูตรการฝึกอบรม
9. ที่ปรึกษาด้านคลังข้อมูล

สถาปัตยกรรมคลังข้อมูล

7:57 PM Posted by Nana
เนื้อหาในส่วนข้อจะกล่าวถึงภาพรวมของสถาปัตยกรรมและองค์ประกอบหลักของคลังข้อมูล ซึ่งประกอบด้วยกระบวนการ เครื่องมือ และเทคโนโลยีที่มีความสัมพันธ์กับคลังข้อมูล ดังนี้
1. ข้อมูลปฏิบัติการ (Operational Data)
          ข้อมูลระดับปฏิบัติการที่จะนำไปเก็บบันทึกในคลังข้อมูล สามารถได้จาก
                 - ข้อมูลปฏิบัติการที่บันทึกอยู่ในเครื่องคอมพิวเตอร์เมนเฟรม ซึ่งเป็นข้อมูลในยุคแรกที่มีรูปแบบเป็นฐานข้อมูลแบบลำดับชั้น หรือแบบเครือข่าย
                 - ข้อมูลในระดับแผนก ซึ่งจัดเก็บในรูปแบบของระบบแฟ้มข้อมูล เช่น VSAM, RMS รวมถึงข้อมูลที่อยู่ในรูปแบบของฐานข้อมูลเชิงสัมพันธ์ เช่น Informix, ORACLE เป็นต้น
                 - ข้อมูลส่วนตัวที่บรรจุอยู่ในเวิร์กสเตชันหรือเวิร์ฟเวอร์ส่วนตัว
                 - แหล่งข้อมูลจากภายนอก เช่น อินเทอร์เน็ต ฐานข้อมูลการดำเนินงานทางธุรกิจ หรือฐานข้อมูลที่เกี่ยวข้องกับข้อมูลตัวแทนจำหน่ายหรือลูกค้า
นอกจากนี้ยังรวมถึงสื่อจัดเก็บข้อมูลปฏิบัติการ (Operational Data Store; ODS) ที่เป็นแหล่งรวมของข้อมูลปฏิบัติการปัจจุบันที่ได้รับการปรับลูกแบบโครงสร้างแล้ว รวมถึงการสัดข้อมูลจากแหล่งข้อมูลให้คงไว้ซึ่งข้อมูลที่จำเป้นต่อการนำไปวิเคราะห์ในคลัง

2. ผู้จัดการงานโหลดข้อมูล (Load Manager)
          ผุ้จัดการงานโหลดข้อมูลเป็นผู้ที่ทำหน้าที่เกี่ยวกับการเตรียมข้อมูล ก่อนนำเข้าไปเก็บไว้ในคลัง ซึ่งถือเป็นงานส่วนหน้า (Frontedn) ที่ปฏิบัติงานด้านคัดกรองข้อมูลเพื่อโหลดข้อมูลเข้าไปในคลัง การปฏิบัติงานในส่วนนี้เกี่ยวข้องกับการแปลงข้อมูลให้อยู่ในรูปแบบมาตรฐานก่อนส่งเข้าไปในคลัง ขนาดและความซับซ้อนของานส่วนนี้จะเกี่ยวข้องกับคลังข้อมูลและแหล่งข้อมูลที่มาจากต่างผลิตภัณฑ์ ดังนั้นผู้จัดการส่วนนี้ต้องใช้เครื่องมือ หรืออาจสร้างโปรแกรมขึ้นมาใช้เอง เพื่อทำการรวมข้อมูลต่างๆ ที่มาจากต่างผลิตภัณฑ์

3. ผู้จัดการคลัง (Warehouse Manager)
           ผู้จัดการคลังเป็นบุคคลที่ทำหน้าที่ดำเนินการเกี่ยวกับระบบปฏิบัติการ ด้านการจัดการคลังข้อมูลในคลังทั้งหมด ด้วยการนำเครื่องมือการจัดการข้อมูลต่างๆ ของผลิตภัณฑ์ ซึ่งงานของผู้จัดการคลังข้อมูลประกอบด้วย
               - วิเคราะห์ข้อมูล เพื่อให้เกิดความมั่นใจถึงความสอดคล้องตรงกันของข้อมูล
              - แปลงและรวมข้อมูลจากแหล่งข้อมูลลงสู่ตารางคลังข้อมูล
              - สร้างดัชนีและวิวของตารางต่างๆ
             - ดำเนินการนอร์มัลไลเวชัน ถ้าจำเป็น
             - นำข้อมูลมารวมกัน ถ้าจำเป็น
             - สำรองข้อมูลที่สำคัญ

4. ผู้จัดการคิวรี
          ผู้จัดการคิวรีเป็นงานส่วนหลัง (backend) ที่มีหน้าที่ดำเนินการเกี่ยวกับการปฏิบัติงานด้านการจัดการยูสเซอร์คิวรี ในส่วนนี้จะต้องทำการสร้างคิวรีด้วยเครื่องมือของผลิตภัณฑ์นั้นๆ เพื่อให้สามารถเข้าถึงข้อมูล ตรวจสอบคลังข้อมูล ความสะดวกในการใช้งานฐานข้อมูล และการสร้างโปรแกรมขึ้นเพื่อใช้งาน ในบางครั้งผู้จัดการคิวรีอาจจำเป็นต้องสร้าง Query Profile เพื่ออนุญาตให้ผู้จัดการคลังข้อมูลในการกำหนดดัชนีและการรวมข้อมูลตามความเหมาะสม

5. ข้อมูลรายละเอียด (Detailed Data)
          พื้นที่ของคลังข้อมูลส่วนนี้จะจัดเก็บข้อมูลรายละเอียดทั้งหมดในโครงร่างฐานข้อมูล โดยข้อมูลรายละเอียดส่วนนี้จะถูกรวบรวมเพื่อส่งไปยังลำดับถัดไป

6. ข้อมูลสรุปผลโดยคร่าวและข้อมูลสรุปขั้นสูง (Lightly and Highly Summarized Data)
           พื้นที่คลังส่วนนี้จะจัดเก็บข้อมูลสรุปคร่าวๆ และข้อมูลสรุปขั้นสูงที่ถูกสร้างโดยผู้จัดการคลัง โดยพื้นที่ส่วนนี้จะเป็นพื้นที่ชั่วคราวในคลังเพื่อการเปลี่ยนแปลงหัวข้อ และตอบสนองงานคิวรีที่อาจเปลี่ยนแปลงไปตามความต้องการ จุดประสงค์ของสารสนเทศที่สรุปผลมานั้นก็เพื่อเพิ่มความเร็วในการประมวลผลของคิวรี ถึงแม้ว่าในส่วนงานนี้ต้องเพิ่มภาระงานด้านสรุปผลข้อมูล ด้วยการขจัดข้อมูลที่ไม่จำเป็นออกไปโดยจัดเก็บเฉพาะข้อมูลที่เป็นผลสรุป ทั้งนี้เพื่อการตอบคำถามให้แต่ผู้ใช้ได้ โดยข้อมูลสรุปเหล่านี้จะมีการปรับปรุงทุกครั้งเมื่อมีข้อมูลใหม่โหลดเข้ามาในครั้ง

7. การสำรองข้อมูล (Archiver/Backup Data)
          ถึงแม้ว่าข้อมูลสรุปผลจะถูกสร้างมาจากข้อมูลรายละเอียด แต่ก็มีวคามจำเป็นต้องสำรองเก็บไว้บนสื่อบันทึกข้อมูลออนไลน์ หรืออาจย้ายข้อมูลเหล่านี้ไปเก็บไว้ในเทปแม่เหล็กหรือออปติคัลดิสก์

8. ข้อมูลที่ใช้อธิบายข้อมูล (Meta-Data)
         เนื่องจากข้อมูลในคลังข้อมูลจะนำไปใช้ในการวิเคราะห์ตามหัวข้อธุรกิจที่ผู้ใช้สนใจ ดังนั้นจึงจำเป็นต้องมีเครื่องมือที่ใช้สำหรับแยกข้อมูลตามรายละเอียด ซึ่งก้คือ Meta-Data ที่จัดเป็นเครื่องมือหนึ่งที่ใช้อธิบายข้อมูลของข้อมูลนั่นเอง กล่าวคือ เป็นรายละเอียดเกี่ยวกับข้อมูลที่จัดเก็บในคลัง เพื่อใช้ในการตอบคำถามบางอย่าง เช่น ข้อมูลนี้มาจากที่ใด ระบบใด มีรูปแบบข้อมูลแบบใด มีขัดจำกัดในการใช้งานอย่างไรบ้าง ถูกปรับปรุงครั้งล่าสุดเมื่อใด และมีรูปแบบที่กำหนดไว้อย่างไรในฐานข้อมูล เป็นต้น ดังนั้น Meta-Data จึงเป็นรายละเอียดที่สำคัญมาก เพื่อที่จะได้สามารถนำข้อมูลที่มีรายละเอียดที่ถูกต้องมาวิเคราะห์

9. เครื่องมือการเข้าถึงข้อมูลของผู้ใช้ (End-User Access Tools)
          เครื่องมือการเข้าถึงข้อมูลสำหรับผู้ใช้เป็นส่วนที่เกี่ยวข้องกับเครื่องมือต่างๆ ที่ผู้ใช้นำไปใช้งานเพื่อโต้ตอบกับคลังข้อมูล คลังข้อมูลต้องสนับสนุนวิธีการทาง Ad Hoc และการวิเคราะหืงานประจำ โดยมีเครื่องมือต่างๆ ที่ประกอบด้วยสิ่งเหล่านี้
-          เครื่องมือการสร้างรายงานและคิวรี
-          เครื่องมือการสร้างแอผพลิเคชัน
-          เครื่องมือระบบสารสนเทศสำหรับผู้บริหารระดับสูง
-          เครื่องมือการประมวลผล OLAP

-          เครื่องมือ Data Mining

ความสัมพันธ์ระบบคลังข้อมูลและระบบฐานข้อมูล

7:54 PM Posted by Nana
        ในปัจจุบันมีการใช้งานฐาานข้อมูลอย่างกว้างขวางในระบบงาานทั่วไป จึงมีการวิจัยและพัฒนาวิธีเก็บข้อมูลจำนวนมาก รวมถึงการค้นหาและนำข้อมูลที่ต้องการออกมาจากระบบฐานข้อมูลด้วย แต่เนื่องจากระบบฐานข้อมูลทั่วไปที่นิยมใช้อยู่ในปัจจุบันมีหลักในการเก็บข้อมูลที่เน้นในเรื่องการลดความซ้ำซ้อน รักษาความถูกต้อง ลดการสูญหายของข้อมูล และลดความผิดพลาดที่เกิดขึ้นจากการแก้ไขข้อมูล

          เนื่องจากฐานข้อมูลทั่วไป มีลักษณะดังได้กล่าวมาแล้ว จึงมีความสามารถเพียงแค่การเรียกใช้ข้อมูลที่มีอยู่ แต่ไม่สามารถจะนำมาช่วยในการสนับสนุนการตัดสินใจได้ เพราะเมื่อมีการเรียกใช้ข้อมูลจะต้องเรียกใช้ข้อมูลจากฐานข้อมูลขนาดใหญ่ ซึ่งมีข้อมูลจำนวนมหาศาลและมีการแตกตารางที่นอร์มัลไลซ์แล้วออกเป็นหลายๆ ตาราง จึงไม่รองรับคำถามที่ต้องการจะนำมาใช้ในการสนับสนุนการตัดสินใจ มรการรวมกันของตารางต่างๆ ที่ซับซ้อน ซึ่งจะทำให้ประสิทธิภาพของการค้นหาข้อมูลจากบานข้อมูลน้อยลง และทำงานช้าลง ไม่สามารถเรียกใช้ข้อมูลที่ต้องการได้ทั้งหมดเพราะมีรูทีนอัตโนมัติ จึงมีวคามสามารถในกาารค้นหาข้อมูลที่ไม่ซ้ำซ้อนเท่านั้น นอกจากนี้การเก็บข้อมูลในระบบฐานข้อมูลทั่วไป ยังไม่มีการเก็บข้อมูลย้อนหลัง เพื่อใช้ช่วยในการคาดคะเนแนวโน้มที่คาดว่าจะเป็นไปได้ในอนาคต

          โดยระบบคลังข้อมูลจะแยกกลุ่มข้อมูลสารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้ประจำวัน มาเก็บอยู่ในระบบฐานข้อมูล RDBMS ทำให้การเรียกใช้ข้อมูลชุดนี้ทำได้อย่างยืดหยุ่น จากเครื่องมือที่อยู่บนเครื่องคอมพิวเตอร์เดสก์ทอปทั่วไป โดยลด off-loading เพื่อเพิ่มกลไกช่วยตัดสินใจ ปรับปรุงเวลาที่ตอบสนองให้รวดเร็วขึ้นอย่างมาก และผู้บริหารสามรถเรียกข้อมูลรายละเอียดที่จำเป็นที่ถูกเก็บมาก่อนหน้านี้ มาช่วยในการตัดสินใจในทางธุรกิจแม่นยำขึ้น

        ความแตกต่างอีกประการหนึ่งคือผู้ใช้คลังข้อมูลมักจะต้องจัดการกลุ่มข้อมูลด้วยตนเองมากกว่าผู้ใช้ฐานข้อมูลธรรมดา ยกตัวอย่างผู้ใช้อาจต้องวิเคราะห์ผลกระทบของการทำการตลาดแบบต่างๆ หรือต้องการจัดกลุ่มการขายสินค้าแยกตามผลิตภัณฑ์ หรือรูปแบบของการจัดผลิตภัณฑ์ เช่น การห่อรวมสินค้าไว้ในบรรจุภัณฑ์สีต่างๆ หรือการรวมผลิตภัณฑ์ต่างรูปแบบไว้ด้วยกัน  
        นอกจากาการรวมข้อมูลเข้ามารวมกันแล้ว ทผู้ใช้ยังอาจต้องการที่จะแยกแยะข้อมูลในแบบที่ตนต้องการได้ ยกตัวอย่างในการจัดทำคลังข้อมูลเกี่ยวกับนักวิจัยและผลงานวิจัยของผระเทศ หน่วยงานอาจจะเก็บข้อมูลไว้เป็นกลุ่มก้อนโดยไม่ได้แยกสาขา แต่ต่อมาผู้ใช้อาจจะต้องการนำข้อมูลนักวิจัยมาวิเคราะห์แยกแยะว่าทั้งประเทศมีนักวิจัยสาขาต่างๆ เป็นตชจำนวนเท่าใด ทำงานวิจัยด้านใดบ้าง ใช้เงินด้านวิจัยไปเท่าใดบ้าง เป็นต้น โดยปกติแล้วการจัดทำฐานข้อมูลให้สามารถวิเคราะห์ แยกแยะข้อมูลในแบบนี้ได้นั้นเป็นเรื่องไม่ยาก แต่ในการออกแบบคลังข้อมูลนั้นจำเป็นต้องเผื่อให้ผู้ใช้หลายคนสามารถแยกแยะข้อมูลตามความต้องการที่แตกต่างกันได้ด้วย

         ผู้ใช้จำนวนมากในปัจจุบันนี้อาจใช้ซอฟต์แวร์หลากหลายประเภทสำหรับเครื่องคอมพิวเตอร์ส่วนบุคคล ผู้ใช้บางคนอาจใช้โปรแกรมสเปรดชีสในการวิเคราะห์ข้อมูล และผู้ใช้บางคนอาจต้องการใช้โปรแกรมวิเคราะห์สถิติอื่นๆ ดังนั้นผู้ใช้เหล่านี้อาจจะต้องมีความต้องการในการนำเข้าข้อมูลจากคลังข้อมูลมาไว้ในแฟ้มข้อมูลที่มีรูปแบบตรงกับโปรแกรมที่ตนต้องการใช้ ความต้องการด้านนี้นับว่าสำคัญมากที่สุดในการจัดทำคลังข้อมูล

          งานอย่างหนึ่งที่นิยมใช้บานข้อมูลกันมาก คืองานบันทึกข้อมูลธุรกรรมเอาไว้เพื่อประมวลผลข้อมูลธุรกรรมเหล่านี้ได้แก่ ข้อมูลการสั่งซื้อสินค้าของลูกค้า ข้อมูลการซื้อบัตรโดยสารเครื่่องบิน ข้อมูลการฝากหรือถอนเงินของลูกค้าธนาคาร แต่เดินนั้นการบันทึกข้อมูลธุรกรรมเริ่มต้นด้วยการใช้กระดาษแบบฟอร์มสำหรับให้ลูกค้ากรอกข้อมูล ดังนั้นจึงนำแบบฟอร์มมาบันทึกข้อมูลลงในฐานข้อมูลระบบคอมพิเตอร์ในระบบ Batch แต่นปัจจุบันนี้การบันทึกธุรกรรมได้เปลี่ยนไปเป็นระบบ Online เป็นส่วนใหญ่ ในระบบแบบนี้กระบวนการบันทึกข้อมูลมีลักษระอัตโนมัติมากขึ้นและใช้อุปกรณ์บันทึกข้อมูลที่สามารถเก็บข้อมูลลงในฐานข้อมูลของคอมพิวเตอรืได้ทันที เช่น การใช้อุปกรณ์ฝากถอนเงินโดยอัตโนมัติ (ATM) ทำให้สามารถประมวลผลการฝากถอนเงินได้ทันที เป็นต้น

สถาปัตยกรรมและองค์ประกอบของคลังข้อมูล

7:52 PM Posted by Nana
        ข้อมูลที่เอามาใช้ในการตัดสินใจ จะถุกรวบรวมไว้ซึ่งอาจอยู่ในรูปแบบที่แตกต่างกัน เช่นในรูปแบบของแฟ้มข้อมูล หรือฐานข้อมูล ดังนั้นจึงจำเป็นต้องนำข้อมูลเหล่านี้มาผ่านกระบวนการแปลงข้อมูลให้อยู่ในมาตรฐานเดียวกัน เทคโนโลยีระบบคลังข้อมูลจะประกอบไปด้วย 3 ส่วนหลัก คือ Data Extraction Tool, Database และ Analysis Tool โดยที่ Data Extraction Tool ใช้ดึงข้อมูลที่สนใจเพื่อการวิเคราะห์จากต้นทางและทำการแปลงข้อมูลก่อนเก็บข้อมูลไว้ในระบบฐานข้อมูล เพื่อใช้ Analysis Tool มาวิเคราะห์ข้อมูลอีกทีหนึ่ง ดังนั้นระบบฐานข้อมูลจึงเป็นแหลงเก็บข้อมูลที่สนใจและคัดเลือกแล้วเพื่อใช้ในการวิเคราะห์ระบบคลังข้อมูล

ประโยชน์ของระบบคลังข้อมูล

7:52 PM Posted by Nana
          โดยทั่วไปแล้วข้อมูล Operational Database จะเก็บข้อมูลในรูปแบบ Transaction Systems เมื่อมีความต้องการข้อมูลในอันที่จะนํามาใช้ช่วยในการตัดสินใจก็จะประสบปัญหาต่างๆ เช่น
  1. บุคลากรทางด้าน Information Systems จำเป็นต้องเรียกข้อมูลจากฐานข้อมูลขนาดใหญ่ ซึ่งมีข้อมูลมากเกินความต้องการ ส่งผลให้ประสิทธิภาพของ Transaction Operational Database ทำงานได้ช้าลง
  2. ข้อมูลจะเป็นรูปแบบข้อมูลตารางเท่านั้น
  3. ข้อมูลจะถูกนำเสนอในรูปแบบที่ตายตัว ไม่สามารถเปลี่ยนแปลงตามความต้องการของผู้ใช้
  4. ไม่ตอบสนองความต้องการของการตัดสินใจ เพราะข้อมูลสําหรับการตัดสินใจมีความสลับซับซ้อนสูง มีการรวมตัวกันของข้อมูลจากตารางต่างๆ หลายๆ ตารางข้อมูล
  5. ไม่ตอบสนองการสอบถามข้อมูล (Data Queries) สําหรับผู้ใช้
  6. มีข้อมูลย้อนหลังน้อย (Historical Data)
  7. ข้อมูลถูกจัดเก็บกระจัดกระจายตามที่ต่างๆ ซึ่งยากต่อการเรียกใช้หรือขาดความสัมพันธ์ทางธุรกิจอันอาจจะต้องเสียเวลาในการทําให้สอดคล้อง หรือเกิดความซ้ำซ้อนของข้อมูลได้

           จากอุปสรรคที่กล่าวมาข้างต้นคลังข้อมูลจึงได้ถูกออกแบบมาเพื่อตอบสนองงานในรูปแบบการตัดสินใจโดยการแยกฐานข้อมูลออกจาก Operational Database และเก็บข้อมูลในรูปแบบข้อมูลสรุป (Summary Data)  ซึ่งข้อมูลสรุปนี้จะเลือกแต่เฉพาะข้อมูลที่มีความสําคัญต่อการตัดสินใจหรือเพื่อใช้ในการบริหารไปจนถึงการกําหนดแผนงานในอนาคต
          ในระบบคลังข้อมูล  ข้อมูลที่ซับซ้อนจะถูกรวบรวมหรือเปลี่ยนแปลงให้ง่ายต่อการจัดเก็บและสามารถเรียกกลับมาใช้ได้อย่างรวดเร็วและถูกต้อง  โดยข้อมูลต่างๆ เหล่านี้จะถูกนํามาใช้สำหรับการวิเคราะห์และช่วยในเรื่องการตัดสินใจโดยอาศัยเครื่องมือ (Tool) ที่อยู่ในเครื่องคอมพิวเตอร์ที่เป็น  ซอฟต์แวร์มาใช้ในการจัดการทำรายงานและเพิ่มประสิทธิภาพสำหรับการตัดสินใจให้รวดเร็วยิ่งขึ้น โดยผู้บริหาร นักวางแผน และนักวิเคราะห์ข้อมูลสามารถเรียกหาข้อมูลหรือสอบถาม (Query) เพื่อให้ได้รับคําตอบในรูปแบบตารางรายงาน  หรือรายงาน  กราฟเพื่อมาทําการวิเคราะห์ข้อมูลลด้วยตนเองเช่น

  1. การเปรียบเทียบยอดขายระหว่างช่วงเวลาในอดีตกับปัจจุบันไปจนถึงการทําพยากรณ์ยอดขายในอดีต (Forecasting)
  2. การหายอดขายสูงสุดหรือตํ่าสุด
  3. การเปรียบเทียบยอดขาย ต้นทุน กําไร ในรูปแบบตารางรายงาน หรือรายงาน กราฟ

          ซึ่งเครื่องมือนี้ถือได้ว่าเป็นสิ่งสำคัญในอันที่จะนําองค์กรไปสู่ความสําเร็จในกระบวนการตัดสินใจ  ในปัจจุบันเครื่องมือที่ตอบสนองงานเพื่อช่วยผู้บริหารสำหรับการตัดสินใจมีอยู่มากมายในตลาด  ทั้งนี้ก็เป็นทางเลือกของผู้ใช้ในการที่จะเลือกเครื่องมือที่มีประสิทธิภาพสูงสุดเพื่อตอบสนองงานของผู้บริหารในกระบวนการตัดสินใจต่อไป

          จะเห็นได้ว่าการจัดทําคลังข้อมูลเป็นความท้าทายอย่างหนึ่งของหน่วยงาน ทั้งนี้พราะหน่วยงานต่างๆ มักจะมีข้อมูลธุรกรรมที่ไม่มีความต้องกัน (Consistent) และมีความลักลั่นอยู่มากดังได้อธิบายไปบ้างแล้ว ดังนั้นการจัดทําคลังข้อมูลจะต้องหาทางแก้ปัญหานี้ให้ได้ อีกประการหนึ่งก็คือข้อมูลบางส่วนหายไปหรือมีไม่ครบ ยกตัวอย่างบริษัทแห่งหนึ่งต้องการวิเคราะห์ความสนใจของลูกค้าที่ใช้บัตรสมาชิกที่บริษัทออกให้  โดยกำหนดจะแยกความสนใจว่ามีความแตกต่างระหว่างเพศหรือไม่ แต่ในการจัดทำระบบประมวลผลธุรกรรมตั้งแต่แรกนั้นนักวิเคราะห์ระบบไม่ได้กําหนดให้เก็บข้อมูลเพศของลูกค้าเอาไว้เพราะเห็นว่าไม่เกี่ยวกับธุรกรรม  ดังนั้นผู้ใช้จึงไม่สามารถนําข้อมูลมาวิเคราะห์ได้  ในกรณ์เช่นนี้ระหว่างการจัดทําคลังข้อมูลก็จะต้องจัดให้มีพนักงานที่ทําหน้าที่ศึกษาข้อมูลโดยพิจารณาจากแบบฟอร์มเดิมแล้วนํามาบันทึกเป็นข้อมูลเพิ่มเติมขึ้น

         การจัดทําคลังข้อมูลจะมีความสําคัญมากขึ้นในอนาคต  เพราะปัจจุบันนี้ผู้ใช้และผู้บริหารของหน่วยงานเริ่มมีเข้าใจความสำคัญของข้อมูลมากขึ้น  และเริ่มตระหนักว่าหากนำข้อมูลมาวิเคราะห์ให้เข้าใจสถานภาพหรือเหตุการณ์ ที่เกิดขึ้นแล้วจะทําให้หน่วยงานหรือบริษัทสามารถตอบสนองต่อเหตุการณ์ที่เกิดขึ้นได้ดียิ่งขึ้นและจะทำให้หน่วยงานหรือบริษัททำงานบรรลุวัตถุประสงค์และเป้าหมายได้ดียิ่งขึ้นตามไปด้วย

วัตถุประสงค์ของการสร้างคลังข้อมูล

7:46 PM Posted by Nana
          เป้าหมายของการสร้างคลังข้อมูลคือ  การแยกกลุ่มข้อมูลสารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้งานประจำวัน (Operational Database) มาเก็บอยู่ใน Relational Database Management Systems (RDBMS) ประสิทธิภาพสูง และทำให้การเรียกใช้ข้อมูลชุดนี้ทำได้อย่างยืดหยุ่น จากเครื่องมือที่อยู่บนเครื่องเดสก์ทอปทั่ไป  โดยลด Off-loading เพิ่มกลไกการช่วยตัดสินใจ  ปรับปรุงเวลาที่ตอบสนอง (Response time)  รวดเร็วยิ่งขึ้นอย่างมากและผู้บริหารสามารถเรียกข้อมูลรายละเอียดที่จำเป็น  ที่ถูกเก็บมาก่อนหน้านี้ (Historical Data) มาใช้ช่วยในการตัดสินใจทางธุรกิจแม่นยำขึ้น

เป้าหมายในการสร้างคลังข้อมูลมีดังนี้
  1. คลังข้อมูลทําให้สามารถเข้าถึงข้อมูลขององค์กรได้  ผู้จัดการและนักวิเคราะห์ขององค์สามารถเชื่อมต่อเข้าไปยังคลังข้อมูลจากเครื่องคอมพิวเตอร์ของตนได้   ซึ่งการเชื่อต่อสามารถทำได้ทันทีตามความต้องการและด้วยประสิทธิภาพสูง  เครื่องมือที่มีให้กับผู้จัดการและนักวิเคราะห์ใช้งานง่าย สามารถออกรายงานได้ด้วยการคลิกปุ่มเดียว
  2. ข้อมูลในคลังข้อมูลมีความถูกต้องตรงกันหมด คําถามเดียวกันต้องได้รับคำตอบที่เหมือนกันเสมอไม่ว่าผู้ถามจะเป็นใคร ถามเวลาใด
  3. ข้อมูลในคลังข้อมูลสามารถถูกวิเคราะห์จากหัวข้อในธุรกิจประเภทนั้น โดยแบ่งข้อมูลหรือรวมข้อมูลมาวิเคราะห์ตามความต้องการ
  4. คลังข้อมูลเป็นส่วนที่ผลิตข้อมูลจาก OLTP ข้อมูลไม่เพียงแต่ถูกรวบรวมมาไว้ที่ศูนย์กลางอย่างเดียว  แต่จะถูกรวบรวมอย่างระมัดระวังจากแหล่งข้อมูลหลายๆ แห่งนอกองค์กรด้วย  แล้วมาปรับปรุงให้เหมาะสมกับการใช้งานเท่านั้น  ถ้าข้อมูลเชื่อถือไม่ได้หรือไม่สมบูรณ์จะไม่ถูกอนุญาตให้นำไปใช้
  5. คุณภาพของข้อมูลในคลังข้อมูลเป็นตัวผลักดันให้สามารถทําการ Re-engineering ธุรกิจได้


คุณสมบัติของคลังข้อมูล

7:45 PM Posted by Nana
คุณสมบัติสำคัญของคลังข้อมูลที่แสดงให้เห็นถึงความแตกต่างจากฐานข้อมูลทั่วไป ประกอบด้วย
1. Subject Oriented
2. Integrated
3. Time-Variant
4. Non-Volatile


1. Subject Oriented
          คลังข้อมูลจะต้องถูกสร้างด้วยหัวข้อหลักทางธุรกิจที่องค์กรนั้นสนใจ ตัวอย่างหัวข้อที่น่าสนใจของธุรกิจขายสินค้า เช่น ลูกค้า สินค้า ยอดขาย อินวอยซ์ลูกค้า การควบคุมสต็อก และการขายสินค้า สิ่งเหล่านี้ล้วนสะท้อนในความต้องการจัดเก็บเพื่อใช้ในการสนับสนุนการตัดสินใจ การวิเคราะห์ และดาต้าไมนิง (Data Mining)
         ฐานข้อมูลระดับปฏิบัติการจะถูกออกแบบมาเพื่อใช้กับระบบงานแต่ละอย่าง เช่นการขออนุมัติกู้เงิน การฝากเงิน สินเชื่อ ซึ่งแตกต่างกับระบบคลังข้อมูลที่มีกรจัดกลุ่มตามหัวข้อหลักที่องค์กรสนใจ เช่น ลูกค้า ผู้ขาย ผลิตภัณฑ์ เป็นต้น


2. Integrated
          เป็นไปได้ว่าข้อมูลที่นำมาใช้ประกอบการตัดสินใจนั้น สามารถได้มาจากแหล่งข้อมูลภายในและแหล่งข้อมูลภายนอก นั่นย่อมหมายถึงความแตกต่างในระบบ รวมทั้งอาจมีการจัดเก็บข้อมูลในรูปแบบที่แตกต่างกัน หรือมาจากความแตกต่างของแพลตฟอร์ม ดังนั้นระบบ Integrated จะต้องมีความสามารถในการรวมข้อมูลเหล่านั้นให้สอดคล้องหรือผสมผสานให้เป็นหนึ่งเดียวได้
          ฐานข้อมูลระดับปฏิบัติการ ต่างก็มีการออกแบบฐานข้อมูลที่แตกต่างกัน เช่นการอ้างอิงในรูปแบบวันที่ที่แตกต่างกัน ซึ่งอาจจัดอยู่ในรูปแบบของ yymmdd, mmddyy หรือ mmddyyyy ดังนั้นระบบ Integrated จะต้องสามารถรวบรวมให้เป็นหนึ่งเดียวเพื่อให้ได้รูปแบบวันที่รูปแบบเดียวกัน รวมถึงหน่วยวัดของผลิตภัณฑ์ที่อาจจะใช้หน่วยอ้างอิงที่แตกต่างกัน เช่น เซนติเมตร นิ้ว หลา ดังนั้นระบบ Integrated จะต้องสามารถทำการแปลงหน่วยวัดเหล่านี้ให้เป็นหน่วยเดียวกันได้


3. Time-Variant
           ข้อมูลในฐานข้อมูลเชิงปฏิบัติการมุ่งเน้นความเป็นปัจจุบัน และจะต้องปรับปรุงให้ทันสมัยอยู่ตลอดเวลา แต่ข้อมูลในคลังข้อมูล จะเป็นข้อมูลที่มีช่วงอายุในระยะเวลาใด เวลาหนึ่ง ซึ่งอาจจะเป็นตั้งแต่ 5 ถึง 10 ปี แต่ทั้งนี้ก็ขึ้นอยู่กับความเหมาะสมเป็นหลักด้วย การนำข้อมูลย้อนหลังที่เก็บรวบรวมไว้ ก็เพื่อนำมาวิเคราะห์เปรียบเทียบหาแนวโน้มและใช้พยากรณ์ทางธุรกิจ



4. Non-Volatile

          เป็นที่เข้าใจแล้วว่าข้อมูลในคลังข้อมูลนั้นมีความแตกต่างจากฐานข้อมูลที่ใช้งานประจำวัน ฐานข้อมูลประจำวัน มักมีการเพิ่ม ลบ หรือปรับปรุงข้อมูลเพื่อให้ทันสมัยอยู่ตลอดเวลา ในขณะที่คลังข้อมูลมีวัตถุประสงค์เพื่อให้ผู้ใช้เข้าถึงเพื่อนำมาวิเคราะห์เท่านั้น ในการรับปรุงข้อมูลในคลังข้อมูลนั้นถือเป็นเรื่องใหญ่มาก เพราะรูปแบบการเก็บข้อมูลในคลังข้อมูล มุ่งเน้นประสิทธิภาพด้านการเรียกใช้ข้อมูลที่มีความรวดเร็วสูงเป็นสำคัญ มากกว่าพิจารณาความซ้ำซ้อนของข้อมูล อย่างไรก็ตาม หากมีความจำเป็นต้องแก้ไขหรือปรับปรุง จะต้องเป็นวิธีที่ไม่ส่งผลกระทบต่อบานข้อมูลในคลัง เช่น การบันทึกช่วยจำ หรือการสร้างตัวแปรใหม่ เป็นต้น

คลังข้อมูล

7:44 PM Posted by Nana
              แนวโน้มการพัฒนาเทคโนโลยีฐานข้อมูลเป็นไปอย่างไม่หยุดนิ่ง องค์กรธุรกิจต่างก็เห็นพ้องต้องกันในความสำคัญของฐานข้อมูล จึงมีการจัดเก็บฐานข้อมูลขององค์กรไว้เพื่อใช้งาน แต่การนำเสนอข้อมูลต่างๆ จากฐานข้อมูลใช่ว่าจะมีเพียงแค่รายงานประจำวัน รายงานสรุปผล แต่ได้รวมถึงเทคโนโลยีด้านระบบฐานข้อมูลที่มีรวบรวมข้อมูลขนาดใหญ่มาก เพื่อนำไปใช้ช่วยในการประกอบการตัดสินใจ
ข้อมูลที่ใช้อยู่ในปัจจุบันเรียกว่าฐานข้อมูลเชิงปฏิบัติการ (Operational Database) แต่ละวันจะมีปริมาณข้อมูลชนิดนี้เพิ่มขึ้นเรื่อยๆ ครั้นเมื่อมีการจัดเก็บข้อมูลประเภทนี้มากขึ้น ข้อมูลย้อนหลังเหล่านี้จึงจำเป็นต้องนำแยกเก็บไว้บนสื่อบันทึกข้อมูลต่างหาก เช่น เทป ดิสเก็ตต์ความจุสูง หรือแผ่นซีดี เป็นต้น สาเหตุที่ต้องนำข้อมูลเหล่านี้มาแยกไว้บนสื่อเก็บข้อมูลต่างหาก ก็เพราะว่าหากนำข้อมูลเหลานั้นมาประมวลผล ก็จะต้องใช้เวลานาน เนื่องจากมีปริมาณข้อมูลจำนวนมาก และอาจจะส่งผลกระทบต่อระบบงานประจำวันที่ดำเนินการอยู่ได้

            ดังนั้นจึงมีแนวคิดเรื่องคลังข้อมูล (Data Warehouse) เพื่อตอบสนองในรูปแบบของคลังที่ไว้สำหรับเก็บข้อมูลดังกล่าวที่นับวันจะเพิ่มขึ้นทุกขณะมาใช้สำหรับการบริหาร และที่สำคัญสามารถนำข้อมูลเหล่านี้มาใช้เพื่อประกอบการตัดสินใจของผู้บริหารได้ เช่น บริษัทแห่งหนึ่ง มีใบกำกับสินค้าที่จัดเป็นหนึ่งในข้อมูลพื้นฐานของธุรกิจ ที่มีรายละเอียดสำคัญๆ ไว้ เช่น ข้อมูลของลูกค้า  รายการสินค้า วันที่ซื้อ และจำนวนเงิน แต่เมื่อมีการรวบรวมใบกำกับสินค้าดังกล่าวไว้เป็นข้อมูลพื้นฐานเพื่อใช้ในการวิเคราะห์ข้อมูลต่างๆ ของผลิตภัณฑ์ของทางบริษัท เช่น การนำข้อมูลดังกล่าว มาใช้ในการพัฒนาผลิตภัณฑ์ใหม่ๆ การสร้างมุมมองระหว่างผลิตภัณฑ์กับลูกค้า  รวมถึงการเพิ่มยอดขายให้สูงขึ้น ซึ่งล้วนแต่เป็นสิ่งที่ผู้บริหารต้องการทั้งสิ้น แต่แหล่งที่เก็บข้อมูลของคลังข้อมูล นับวันจะมีปริมาณที่สูงขึ้นถึงขนาดความจุเทอราไบต์ จึงจำเป็นต้องมีเครื่องมือหรือซอฟต์แวร์เพื่อจัดการกับฐานข้อมูลขนาดใหญ่นี้โดยเฉพาะ นั่นคือเหตุผลที่ระบบคลังข้อมูลจำเป็นต้องแยกจากระบบงานประจำวันที่ดำเนินการอยู่ เพราะหากนำระบบนี้มาใช้ร่วมกันจะส่งผลต่อระบบโดยรวม และจะทำให้การประมวลผลการดำเนินธุรกรรมประจำวันเป็นไปด้วยความล่าช้า

            คลังข้อมูลที่ดี จำเป็นต้องได้รับการจัดการหรือบริหารจัดการที่ดี หลายๆ องค์กรได้นำระบบคลังข้อมูลมาใช้ ซึ่งเป็นที่เข้าใจว่า จำเป็นต้องใช้เงินลงทุนจำนวนมหาศาล แต่ท้ายสุดก็ไม่สามารถบรรลุผลสำเร็จได้ตามวัตถุประสงค์ เนื่องจากขาดการบริหารจัดการข้อมูลในคลังข้อมูล รวมถึงผู้ที่รับผิดชอบงานดังกล่าวจำเป็นต้องมีความรู้และประสบการณ์ที่ดีพอ


          จากข้อมูลที่กล่าวมาข้างต้นนั้น จึงสามารถนิยามความหมายของคลังข้อมูลได้ว่า คลังข้อมูลคือแหล่งจัดเก็บข้อมูลขององค์กรที่ได้รับการออกแบบมาเพื่อใช้สำหรับการวิเคราะห์และตัดสินใจ โดยสนับสนุนการนำข้อมูลทั้งจากแหล่งภายในและแหล่งภายนอกมาประมวลผลร่วมกันได้ ซึ่งข้อมูลที่นำมาประมวลผลจะเป็นข้อมูลย้อนหลังหรือเป็นข้อมูลในอดีตที่จัดเก็บในหลายช่วงเวลา เป็นข้อมูลที่ไม่มีการเคลื่อนไหว แต่อาจจะปรับเพิ่มความเหมาะสมก่อนที่จะนำเข้าไปเก็บในคลัง และมักสกัดหรือคัดเลือกจัดเก็บเฉพาะข้อมูลที่จำเป็นต่อการใช้งานเท่านั้น โดยข้อมูลที่เป็นขยะไม่สามารถนำมาใช้ประโยชน์ได้จะไม่นำไปเก็บในคลังข้อมูล ทั้งนี้ข้อมูลที่เก็บในคลังจะเก็บในรูปแบบของฐานข้อมูลเชิงสัมพันธ์