Friday, June 12, 2015
Tuesday, June 9, 2015
องค์ประกอบของคลังข้อมูล
8:00 PM
Posted by Nana
คลังข้อมูลอาจจะมีข้อมูลเป็นจํานวนมากมายมหาศาล
ดังนั้นจึงจําเป็นต้องมีฐานข้อมูลของตนเองในการเก็บและประมวลผลข้อมูล หน่วยงานต้องมีโปรแกรมจัดการฐานข้อมูลและโปรแกรมอื่นๆ
สําหรับช่วยในการเปลี่ยนรูปแบบข้อมูล จัดกลุ่มข้อมูล รวมข้อมูล และโยกย้ายข้อมูลจากฐานข้อมูลหนึ่งไปยังฐานอื่นๆ โปรแกรมเหล่านี้ต้องทำงานได้ทั้งกับข้อมูลที่เป็นจํานวน ข้อมูลกราฟิก ข้อมูลภาพลักษ์ และ ข้อมูลแบบมัลติมีเดียโปรแกรมเหล่านี้จะต้องสามารถแปลงข้อมูลให้เหมาะสมที่จะนําไปวิเคราะห์ และจัดทํารายงานในรูปแบบต่างๆ ได้
โดยที่คลังข้อมูลมีบริการสำคัญหลายอย่างให้แก่ผู้ใช้งานอาจจะไม่ใช่ผู้เชี่ยวชาญในด้านคอมพิวเตอร์ดังนั้นการจัดคลังข้อมูลจึงจำเป็นต้องจัดการฝึกอบรมให้แก่ผู้ใช้ด้วย นอกจากนั้นยังอาจจะต้องจัดระบบอธิบายการใช้เอาไว้ในระบบด้วยเพื่อให้ผู้ใช้สามารถเรียกคําอธิบายมาใช้เมื่อต้องการได้ ส่วนประกอบสำคัญอีกอย่างหนึ่งก็คือที่ปรึกษาเกี่ยวกับคลังข้อมูลเพื่อช่วยเหลือผู้ใช้ให้สามารถใช้ระบบได้อย่างมีประสิทธิภาพมากขึ้น
ส่วนประกอบของคลังข้อมูลมีดังนี้
1. เครื่องมือสกัดแยก ข้อมูล
2. ข้อมูลที่สกัดและแยกออกมาแล้ว
3. เมตาเดตา (Meta-Data) สําหรับบรรยายเนื้อหา ข้อมูล
4. ฐานข้อมูลสําหรับคลัง ข้อมูล
5. เครื่องมือจัดการข้อมูลในคลัง ข้อมูล
6. โปรแกรมสําหรับจัดส่ง ข้อมูล
7. เครื่องมือวิเคราะห์สําหรับผู้ใช้
8. วัสดุและหลักสูตรการฝึกอบรม
9. ที่ปรึกษาด้านคลัง ข้อมูล
สถาปัตยกรรมคลังข้อมูล
7:57 PM
Posted by Nana
เนื้อหาในส่วนข้อจะกล่าวถึงภาพรวมของสถาปัตยกรรมและองค์ประกอบหลักของคลังข้อมูล
ซึ่งประกอบด้วยกระบวนการ เครื่องมือ และเทคโนโลยีที่มีความสัมพันธ์กับคลังข้อมูล
ดังนี้
1. ข้อมูลปฏิบัติการ (Operational Data)
ข้อมูลระดับปฏิบัติการที่จะนำไปเก็บบันทึกในคลังข้อมูล
สามารถได้จาก
- ข้อมูลปฏิบัติการที่บันทึกอยู่ในเครื่องคอมพิวเตอร์เมนเฟรม
ซึ่งเป็นข้อมูลในยุคแรกที่มีรูปแบบเป็นฐานข้อมูลแบบลำดับชั้น หรือแบบเครือข่าย
- ข้อมูลในระดับแผนก
ซึ่งจัดเก็บในรูปแบบของระบบแฟ้มข้อมูล เช่น VSAM, RMS รวมถึงข้อมูลที่อยู่ในรูปแบบของฐานข้อมูลเชิงสัมพันธ์
เช่น Informix, ORACLE เป็นต้น
- ข้อมูลส่วนตัวที่บรรจุอยู่ในเวิร์กสเตชันหรือเวิร์ฟเวอร์ส่วนตัว
- แหล่งข้อมูลจากภายนอก เช่น อินเทอร์เน็ต
ฐานข้อมูลการดำเนินงานทางธุรกิจ
หรือฐานข้อมูลที่เกี่ยวข้องกับข้อมูลตัวแทนจำหน่ายหรือลูกค้า
นอกจากนี้ยังรวมถึงสื่อจัดเก็บข้อมูลปฏิบัติการ (Operational
Data Store; ODS) ที่เป็นแหล่งรวมของข้อมูลปฏิบัติการปัจจุบันที่ได้รับการปรับลูกแบบโครงสร้างแล้ว
รวมถึงการสัดข้อมูลจากแหล่งข้อมูลให้คงไว้ซึ่งข้อมูลที่จำเป้นต่อการนำไปวิเคราะห์ในคลัง
2. ผู้จัดการงานโหลดข้อมูล (Load Manager)
ผุ้จัดการงานโหลดข้อมูลเป็นผู้ที่ทำหน้าที่เกี่ยวกับการเตรียมข้อมูล
ก่อนนำเข้าไปเก็บไว้ในคลัง ซึ่งถือเป็นงานส่วนหน้า (Frontedn) ที่ปฏิบัติงานด้านคัดกรองข้อมูลเพื่อโหลดข้อมูลเข้าไปในคลัง
การปฏิบัติงานในส่วนนี้เกี่ยวข้องกับการแปลงข้อมูลให้อยู่ในรูปแบบมาตรฐานก่อนส่งเข้าไปในคลัง
ขนาดและความซับซ้อนของานส่วนนี้จะเกี่ยวข้องกับคลังข้อมูลและแหล่งข้อมูลที่มาจากต่างผลิตภัณฑ์
ดังนั้นผู้จัดการส่วนนี้ต้องใช้เครื่องมือ หรืออาจสร้างโปรแกรมขึ้นมาใช้เอง
เพื่อทำการรวมข้อมูลต่างๆ ที่มาจากต่างผลิตภัณฑ์
3. ผู้จัดการคลัง (Warehouse Manager)
ผู้จัดการคลังเป็นบุคคลที่ทำหน้าที่ดำเนินการเกี่ยวกับระบบปฏิบัติการ
ด้านการจัดการคลังข้อมูลในคลังทั้งหมด ด้วยการนำเครื่องมือการจัดการข้อมูลต่างๆ
ของผลิตภัณฑ์ ซึ่งงานของผู้จัดการคลังข้อมูลประกอบด้วย
- วิเคราะห์ข้อมูล
เพื่อให้เกิดความมั่นใจถึงความสอดคล้องตรงกันของข้อมูล
- แปลงและรวมข้อมูลจากแหล่งข้อมูลลงสู่ตารางคลังข้อมูล
- สร้างดัชนีและวิวของตารางต่างๆ
- ดำเนินการนอร์มัลไลเวชัน ถ้าจำเป็น
- นำข้อมูลมารวมกัน ถ้าจำเป็น
- สำรองข้อมูลที่สำคัญ
4. ผู้จัดการคิวรี
ผู้จัดการคิวรีเป็นงานส่วนหลัง (backend) ที่มีหน้าที่ดำเนินการเกี่ยวกับการปฏิบัติงานด้านการจัดการยูสเซอร์คิวรี
ในส่วนนี้จะต้องทำการสร้างคิวรีด้วยเครื่องมือของผลิตภัณฑ์นั้นๆ
เพื่อให้สามารถเข้าถึงข้อมูล ตรวจสอบคลังข้อมูล ความสะดวกในการใช้งานฐานข้อมูล
และการสร้างโปรแกรมขึ้นเพื่อใช้งาน ในบางครั้งผู้จัดการคิวรีอาจจำเป็นต้องสร้าง Query
Profile เพื่ออนุญาตให้ผู้จัดการคลังข้อมูลในการกำหนดดัชนีและการรวมข้อมูลตามความเหมาะสม
5. ข้อมูลรายละเอียด (Detailed Data)
พื้นที่ของคลังข้อมูลส่วนนี้จะจัดเก็บข้อมูลรายละเอียดทั้งหมดในโครงร่างฐานข้อมูล
โดยข้อมูลรายละเอียดส่วนนี้จะถูกรวบรวมเพื่อส่งไปยังลำดับถัดไป
6. ข้อมูลสรุปผลโดยคร่าวและข้อมูลสรุปขั้นสูง (Lightly
and Highly Summarized Data)
พื้นที่คลังส่วนนี้จะจัดเก็บข้อมูลสรุปคร่าวๆ
และข้อมูลสรุปขั้นสูงที่ถูกสร้างโดยผู้จัดการคลัง
โดยพื้นที่ส่วนนี้จะเป็นพื้นที่ชั่วคราวในคลังเพื่อการเปลี่ยนแปลงหัวข้อ
และตอบสนองงานคิวรีที่อาจเปลี่ยนแปลงไปตามความต้องการ
จุดประสงค์ของสารสนเทศที่สรุปผลมานั้นก็เพื่อเพิ่มความเร็วในการประมวลผลของคิวรี
ถึงแม้ว่าในส่วนงานนี้ต้องเพิ่มภาระงานด้านสรุปผลข้อมูล
ด้วยการขจัดข้อมูลที่ไม่จำเป็นออกไปโดยจัดเก็บเฉพาะข้อมูลที่เป็นผลสรุป
ทั้งนี้เพื่อการตอบคำถามให้แต่ผู้ใช้ได้
โดยข้อมูลสรุปเหล่านี้จะมีการปรับปรุงทุกครั้งเมื่อมีข้อมูลใหม่โหลดเข้ามาในครั้ง
7. การสำรองข้อมูล (Archiver/Backup Data)
ถึงแม้ว่าข้อมูลสรุปผลจะถูกสร้างมาจากข้อมูลรายละเอียด
แต่ก็มีวคามจำเป็นต้องสำรองเก็บไว้บนสื่อบันทึกข้อมูลออนไลน์
หรืออาจย้ายข้อมูลเหล่านี้ไปเก็บไว้ในเทปแม่เหล็กหรือออปติคัลดิสก์
8. ข้อมูลที่ใช้อธิบายข้อมูล (Meta-Data)
เนื่องจากข้อมูลในคลังข้อมูลจะนำไปใช้ในการวิเคราะห์ตามหัวข้อธุรกิจที่ผู้ใช้สนใจ
ดังนั้นจึงจำเป็นต้องมีเครื่องมือที่ใช้สำหรับแยกข้อมูลตามรายละเอียด ซึ่งก้คือ Meta-Data
ที่จัดเป็นเครื่องมือหนึ่งที่ใช้อธิบายข้อมูลของข้อมูลนั่นเอง
กล่าวคือ เป็นรายละเอียดเกี่ยวกับข้อมูลที่จัดเก็บในคลัง
เพื่อใช้ในการตอบคำถามบางอย่าง เช่น ข้อมูลนี้มาจากที่ใด ระบบใด
มีรูปแบบข้อมูลแบบใด มีขัดจำกัดในการใช้งานอย่างไรบ้าง ถูกปรับปรุงครั้งล่าสุดเมื่อใด
และมีรูปแบบที่กำหนดไว้อย่างไรในฐานข้อมูล เป็นต้น ดังนั้น Meta-Data จึงเป็นรายละเอียดที่สำคัญมาก
เพื่อที่จะได้สามารถนำข้อมูลที่มีรายละเอียดที่ถูกต้องมาวิเคราะห์
9. เครื่องมือการเข้าถึงข้อมูลของผู้ใช้
(End-User Access Tools)
เครื่องมือการเข้าถึงข้อมูลสำหรับผู้ใช้เป็นส่วนที่เกี่ยวข้องกับเครื่องมือต่างๆ
ที่ผู้ใช้นำไปใช้งานเพื่อโต้ตอบกับคลังข้อมูล คลังข้อมูลต้องสนับสนุนวิธีการทาง Ad
Hoc และการวิเคราะหืงานประจำ โดยมีเครื่องมือต่างๆ
ที่ประกอบด้วยสิ่งเหล่านี้
-
เครื่องมือการสร้างรายงานและคิวรี
-
เครื่องมือการสร้างแอผพลิเคชัน
-
เครื่องมือระบบสารสนเทศสำหรับผู้บริหารระดับสูง
-
เครื่องมือการประมวลผล OLAP
-
เครื่องมือ Data Mining
ความสัมพันธ์ระบบคลังข้อมูลและระบบฐานข้อมูล
7:54 PM
Posted by Nana
ในปัจจุบันมีการใช้งานฐาานข้อมูลอย่างกว้างขวางในระบบงาานทั่วไป จึงมีการวิจัยและพัฒนาวิธีเก็บข้อมูลจำนวนมาก รวมถึงการค้นหาและนำข้อมูลที่ต้องการออกมาจากระบบฐานข้อมูลด้วย แต่เนื่องจากระบบฐานข้อมูลทั่วไปที่นิยมใช้อยู่ในปัจจุบันมีหลักในการเก็บข้อมูลที่เน้นในเรื่องการลดความซ้ำซ้อน รักษาความถูกต้อง ลดการสูญหายของข้อมูล และลดความผิดพลาดที่เกิดขึ้นจากการแก้ไขข้อมูล
เนื่องจากฐานข้อมูลทั่วไป มีลักษณะดังได้กล่าวมาแล้ว จึงมีความสามารถเพียงแค่การเรียกใช้ข้อมูลที่มีอยู่ แต่ไม่สามารถจะนำมาช่วยในการสนับสนุนการตัดสินใจได้ เพราะเมื่อมีการเรียกใช้ข้อมูลจะต้องเรียกใช้ข้อมูลจากฐานข้อมูลขนาดใหญ่ ซึ่งมีข้อมูลจำนวนมหาศาลและมีการแตกตารางที่นอร์มัลไลซ์แล้วออกเป็นหลายๆ ตาราง จึงไม่รองรับคำถามที่ต้องการจะนำมาใช้ในการสนับสนุนการตัดสินใจ มรการรวมกันของตารางต่างๆ ที่ซับซ้อน ซึ่งจะทำให้ประสิทธิภาพของการค้นหาข้อมูลจากบานข้อมูลน้อยลง และทำงานช้าลง ไม่สามารถเรียกใช้ข้อมูลที่ต้องการได้ทั้งหมดเพราะมีรูทีนอัตโนมัติ จึงมีวคามสามารถในกาารค้นหาข้อมูลที่ไม่ซ้ำซ้อนเท่านั้น นอกจากนี้การเก็บข้อมูลในระบบฐานข้อมูลทั่วไป ยังไม่มีการเก็บข้อมูลย้อนหลัง เพื่อใช้ช่วยในการคาดคะเนแนวโน้มที่คาดว่าจะเป็นไปได้ในอนาคต
เนื่องจากฐานข้อมูลทั่วไป มีลักษณะดังได้กล่าวมาแล้ว จึงมีความสามารถเพียงแค่การเรียกใช้ข้อมูลที่มีอยู่ แต่ไม่สามารถจะนำมาช่วยในการสนับสนุนการตัดสินใจได้ เพราะเมื่อมีการเรียกใช้ข้อมูลจะต้องเรียกใช้ข้อมูลจากฐานข้อมูลขนาดใหญ่ ซึ่งมีข้อมูลจำนวนมหาศาลและมีการแตกตารางที่นอร์มัลไลซ์แล้วออกเป็นหลายๆ ตาราง จึงไม่รองรับคำถามที่ต้องการจะนำมาใช้ในการสนับสนุนการตัดสินใจ มรการรวมกันของตารางต่างๆ ที่ซับซ้อน ซึ่งจะทำให้ประสิทธิภาพของการค้นหาข้อมูลจากบานข้อมูลน้อยลง และทำงานช้าลง ไม่สามารถเรียกใช้ข้อมูลที่ต้องการได้ทั้งหมดเพราะมีรูทีนอัตโนมัติ จึงมีวคามสามารถในกาารค้นหาข้อมูลที่ไม่ซ้ำซ้อนเท่านั้น นอกจากนี้การเก็บข้อมูลในระบบฐานข้อมูลทั่วไป ยังไม่มีการเก็บข้อมูลย้อนหลัง เพื่อใช้ช่วยในการคาดคะเนแนวโน้มที่คาดว่าจะเป็นไปได้ในอนาคต
โดยระบบคลังข้อมูลจะแยกกลุ่มข้อมูลสารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้ประจำวัน มาเก็บอยู่ในระบบฐานข้อมูล RDBMS ทำให้การเรียกใช้ข้อมูลชุดนี้ทำได้อย่างยืดหยุ่น จากเครื่องมือที่อยู่บนเครื่องคอมพิวเตอร์เดสก์ทอปทั่วไป โดยลด off-loading เพื่อเพิ่มกลไกช่วยตัดสินใจ ปรับปรุงเวลาที่ตอบสนองให้รวดเร็วขึ้นอย่างมาก และผู้บริหารสามรถเรียกข้อมูลรายละเอียดที่จำเป็นที่ถูกเก็บมาก่อนหน้านี้ มาช่วยในการตัดสินใจในทางธุรกิจแม่นยำขึ้น
ความแตกต่างอีกประการหนึ่งคือผู้ใช้คลังข้อมูลมักจะต้องจัดการกลุ่มข้อมูลด้วยตนเองมากกว่าผู้ใช้ฐานข้อมูลธรรมดา ยกตัวอย่างผู้ใช้อาจต้องวิเคราะห์ผลกระทบของการทำการตลาดแบบต่างๆ หรือต้องการจัดกลุ่มการขายสินค้าแยกตามผลิตภัณฑ์ หรือรูปแบบของการจัดผลิตภัณฑ์ เช่น การห่อรวมสินค้าไว้ในบรรจุภัณฑ์สีต่างๆ หรือการรวมผลิตภัณฑ์ต่างรูปแบบไว้ด้วยกัน
นอกจากาการรวมข้อมูลเข้ามารวมกันแล้ว ทผู้ใช้ยังอาจต้องการที่จะแยกแยะข้อมูลในแบบที่ตนต้องการได้ ยกตัวอย่างในการจัดทำคลังข้อมูลเกี่ยวกับนักวิจัยและผลงานวิจัยของผระเทศ หน่วยงานอาจจะเก็บข้อมูลไว้เป็นกลุ่มก้อนโดยไม่ได้แยกสาขา แต่ต่อมาผู้ใช้อาจจะต้องการนำข้อมูลนักวิจัยมาวิเคราะห์แยกแยะว่าทั้งประเทศมีนักวิจัยสาขาต่างๆ เป็นตชจำนวนเท่าใด ทำงานวิจัยด้านใดบ้าง ใช้เงินด้านวิจัยไปเท่าใดบ้าง เป็นต้น โดยปกติแล้วการจัดทำฐานข้อมูลให้สามารถวิเคราะห์ แยกแยะข้อมูลในแบบนี้ได้นั้นเป็นเรื่องไม่ยาก แต่ในการออกแบบคลังข้อมูลนั้นจำเป็นต้องเผื่อให้ผู้ใช้หลายคนสามารถแยกแยะข้อมูลตามความต้องการที่แตกต่างกันได้ด้วยผู้ใช้จำนวนมากในปัจจุบันนี้อาจใช้ซอฟต์แวร์หลากหลายประเภทสำหรับเครื่องคอมพิวเตอร์ส่วนบุคคล ผู้ใช้บางคนอาจใช้โปรแกรมสเปรดชีสในการวิเคราะห์ข้อมูล และผู้ใช้บางคนอาจต้องการใช้โปรแกรมวิเคราะห์สถิติอื่นๆ ดังนั้นผู้ใช้เหล่านี้อาจจะต้องมีความต้องการในการนำเข้าข้อมูลจากคลังข้อมูลมาไว้ในแฟ้มข้อมูลที่มีรูปแบบตรงกับโปรแกรมที่ตนต้องการใช้ ความต้องการด้านนี้นับว่าสำคัญมากที่สุดในการจัดทำคลังข้อมูล
งานอย่างหนึ่งที่นิยมใช้บานข้อมูลกันมาก คืองานบันทึกข้อมูลธุรกรรมเอาไว้เพื่อประมวลผลข้อมูลธุรกรรมเหล่านี้ได้แก่ ข้อมูลการสั่งซื้อสินค้าของลูกค้า ข้อมูลการซื้อบัตรโดยสารเครื่่องบิน ข้อมูลการฝากหรือถอนเงินของลูกค้าธนาคาร แต่เดินนั้นการบันทึกข้อมูลธุรกรรมเริ่มต้นด้วยการใช้กระดาษแบบฟอร์มสำหรับให้ลูกค้ากรอกข้อมูล ดังนั้นจึงนำแบบฟอร์มมาบันทึกข้อมูลลงในฐานข้อมูลระบบคอมพิเตอร์ในระบบ Batch แต่นปัจจุบันนี้การบันทึกธุรกรรมได้เปลี่ยนไปเป็นระบบ Online เป็นส่วนใหญ่ ในระบบแบบนี้กระบวนการบันทึกข้อมูลมีลักษระอัตโนมัติมากขึ้นและใช้อุปกรณ์บันทึกข้อมูลที่สามารถเก็บข้อมูลลงในฐานข้อมูลของคอมพิวเตอรืได้ทันที เช่น การใช้อุปกรณ์ฝากถอนเงินโดยอัตโนมัติ (ATM) ทำให้สามารถประมวลผลการฝากถอนเงินได้ทันที เป็นต้น
สถาปัตยกรรมและองค์ประกอบของคลังข้อมูล
7:52 PM
Posted by Nana
ข้อมูลที่เอามาใช้ในการตัดสินใจ จะถุกรวบรวมไว้ซึ่งอาจอยู่ในรูปแบบที่แตกต่างกัน เช่นในรูปแบบของแฟ้มข้อมูล หรือฐานข้อมูล ดังนั้นจึงจำเป็นต้องนำข้อมูลเหล่านี้มาผ่านกระบวนการแปลงข้อมูลให้อยู่ในมาตรฐานเดียวกัน เทคโนโลยีระบบคลังข้อมูลจะประกอบไปด้วย 3 ส่วนหลัก คือ Data Extraction Tool, Database และ Analysis Tool โดยที่ Data Extraction Tool ใช้ดึงข้อมูลที่สนใจเพื่อการวิเคราะห์จากต้นทางและทำการแปลงข้อมูลก่อนเก็บข้อมูลไว้ในระบบฐานข้อมูล เพื่อใช้ Analysis Tool มาวิเคราะห์ข้อมูลอีกทีหนึ่ง ดังนั้นระบบฐานข้อมูลจึงเป็นแหลงเก็บข้อมูลที่สนใจและคัดเลือกแล้วเพื่อใช้ในการวิเคราะห์ระบบคลังข้อมูล
ประโยชน์ของระบบคลังข้อมูล
7:52 PM
Posted by Nana
โดยทั่วไปแล้วข้อมูล Operational Database จะเก็บข้อมูลในรูปแบบ Transaction Systems เมื่อมีความต้องการข้อมูลในอันที่จะนํามาใช้ช่วยในการตัดสินใจก็จะประสบปัญหาต่างๆ
เช่น
- บุคลากรทางด้าน Information Systems จำเป็นต้องเรียกข้อมูลจากฐานข้อมูลขนาดใหญ่ ซึ่งมีข้อมูลมากเกินความต้องการ ส่งผลให้ประสิทธิภาพของ Transaction Operational Database ทำงานได้ช้าลง
- ข้อมูลจะเป็นรูปแบบข้อมูลตารางเท่านั้น
- ข้อมูลจะถูกนำเสนอในรูปแบบที่ตายตัว ไม่สามารถเปลี่ยนแปลงตามความต้องการของผู้ใช้
- ไม่ตอบสนองความต้องการของการตัดสินใจ เพราะข้อมูลสําหรับการตัดสินใจมีความสลับซับซ้อนสูง มีการรวมตัวกันของข้อมูลจากตารางต่างๆ หลายๆ ตารางข้อมูล
- ไม่ตอบสนองการสอบถามข้อมูล (Data Queries) สําหรับผู้ใช้
- มีข้อมูลย้อนหลังน้อย (Historical Data)
- ข้อมูลถูกจัดเก็บกระจัดกระจายตามที่ต่างๆ ซึ่งยากต่อการเรียกใช้หรือขาดความสัมพันธ์ทางธุรกิจอันอาจจะต้องเสียเวลาในการทําให้สอดคล้อง หรือเกิดความซ้ำซ้อนของข้อมูลได้
จากอุปสรรคที่กล่าวมาข้างต้นคลังข้อมูลจึงได้ถูกออกแบบมาเพื่อตอบสนองงานในรูปแบบการตัดสินใจโดยการแยกฐานข้อมูลออกจาก
Operational Database และเก็บข้อมูลในรูปแบบข้อมูลสรุป (Summary Data) ซึ่งข้อมูลสรุปนี้จะเลือกแต่เฉพาะข้อมูลที่มีความสําคัญต่อการตัดสินใจหรือเพื่อใช้ในการบริหารไปจนถึงการกําหนดแผนงานในอนาคต
ในระบบคลังข้อมูล ข้อมูลที่ซับซ้อนจะถูกรวบรวมหรือเปลี่ยนแปลงให้ง่ายต่อการจัดเก็บและสามารถเรียกกลับมาใช้ได้อย่างรวดเร็วและถูกต้อง โดยข้อมูลต่างๆ เหล่านี้จะถูกนํามาใช้สำหรับการวิเคราะห์และช่วยในเรื่องการตัดสินใจโดยอาศัยเครื่องมือ
(Tool) ที่อยู่ในเครื่องคอมพิวเตอร์ที่เป็น ซอฟต์แวร์มาใช้ในการจัดการทำรายงานและเพิ่มประสิทธิภาพสำหรับการตัดสินใจให้รวดเร็วยิ่งขึ้น โดยผู้บริหาร นักวางแผน และนักวิเคราะห์ข้อมูลสามารถเรียกหาข้อมูลหรือสอบถาม (Query)
เพื่อให้ได้รับคําตอบในรูปแบบตารางรายงาน หรือรายงาน
กราฟเพื่อมาทําการวิเคราะห์ข้อมูลลด้วยตนเองเช่น
- การเปรียบเทียบยอดขายระหว่างช่วงเวลาในอดีตกับปัจจุบันไปจนถึงการทําพยากรณ์ยอดขายในอดีต (Forecasting)
- การหายอดขายสูงสุดหรือตํ่าสุด
- การเปรียบเทียบยอดขาย ต้นทุน กําไร ในรูปแบบตารางรายงาน หรือรายงาน กราฟ
ซึ่งเครื่องมือนี้ถือได้ว่าเป็นสิ่งสำคัญในอันที่จะนําองค์กรไปสู่ความสําเร็จในกระบวนการตัดสินใจ ในปัจจุบันเครื่องมือที่ตอบสนองงานเพื่อช่วยผู้บริหารสำหรับการตัดสินใจมีอยู่มากมายในตลาด ทั้งนี้ก็เป็นทางเลือกของผู้ใช้ในการที่จะเลือกเครื่องมือที่มีประสิทธิภาพสูงสุดเพื่อตอบสนองงานของผู้บริหารในกระบวนการตัดสินใจต่อไป
จะเห็นได้ว่าการจัดทําคลังข้อมูลเป็นความท้าทายอย่างหนึ่งของหน่วยงาน
ทั้งนี้พราะหน่วยงานต่างๆ มักจะมีข้อมูลธุรกรรมที่ไม่มีความต้องกัน (Consistent)
และมีความลักลั่นอยู่มากดังได้อธิบายไปบ้างแล้ว ดังนั้นการจัดทําคลังข้อมูลจะต้องหาทางแก้ปัญหานี้ให้ได้ อีกประการหนึ่งก็คือข้อมูลบางส่วนหายไปหรือมีไม่ครบ
ยกตัวอย่างบริษัทแห่งหนึ่งต้องการวิเคราะห์ความสนใจของลูกค้าที่ใช้บัตรสมาชิกที่บริษัทออกให้ โดยกำหนดจะแยกความสนใจว่ามีความแตกต่างระหว่างเพศหรือไม่ แต่ในการจัดทำระบบประมวลผลธุรกรรมตั้งแต่แรกนั้นนักวิเคราะห์ระบบไม่ได้กําหนดให้เก็บข้อมูลเพศของลูกค้าเอาไว้เพราะเห็นว่าไม่เกี่ยวกับธุรกรรม ดังนั้นผู้ใช้จึงไม่สามารถนําข้อมูลมาวิเคราะห์ได้ ในกรณ์เช่นนี้ระหว่างการจัดทําคลังข้อมูลก็จะต้องจัดให้มีพนักงานที่ทําหน้าที่ศึกษาข้อมูลโดยพิจารณาจากแบบฟอร์มเดิมแล้วนํามาบันทึกเป็นข้อมูลเพิ่มเติมขึ้น
การจัดทําคลังข้อมูลจะมีความสําคัญมากขึ้นในอนาคต เพราะปัจจุบันนี้ผู้ใช้และผู้บริหารของหน่วยงานเริ่มมีเข้าใจความสำคัญของข้อมูลมากขึ้น และเริ่มตระหนักว่าหากนำข้อมูลมาวิเคราะห์ให้เข้าใจสถานภาพหรือเหตุการณ์ ที่เกิดขึ้นแล้วจะทําให้หน่วยงานหรือบริษัทสามารถตอบสนองต่อเหตุการณ์ที่เกิดขึ้นได้ดียิ่งขึ้นและจะทำให้หน่วยงานหรือบริษัททำงานบรรลุวัตถุประสงค์และเป้าหมายได้ดียิ่งขึ้นตามไปด้วย
วัตถุประสงค์ของการสร้างคลังข้อมูล
7:46 PM
Posted by Nana
เป้าหมายของการสร้างคลังข้อมูลคือ การแยกกลุ่มข้อมูลสารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้งานประจำวัน
(Operational Database) มาเก็บอยู่ใน Relational
Database Management Systems (RDBMS) ประสิทธิภาพสูง และทำให้การเรียกใช้ข้อมูลชุดนี้ทำได้อย่างยืดหยุ่น
จากเครื่องมือที่อยู่บนเครื่องเดสก์ทอปทั่ไป
โดยลด Off-loading เพิ่มกลไกการช่วยตัดสินใจ ปรับปรุงเวลาที่ตอบสนอง (Response time) รวดเร็วยิ่งขึ้นอย่างมากและผู้บริหารสามารถเรียกข้อมูลรายละเอียดที่จำเป็น ที่ถูกเก็บมาก่อนหน้านี้ (Historical
Data) มาใช้ช่วยในการตัดสินใจทางธุรกิจแม่นยำขึ้น
เป้าหมายในการสร้างคลังข้อมูลมีดังนี้
- คลังข้อมูลทําให้สามารถเข้าถึงข้อมูลขององค์กรได้ ผู้จัดการและนักวิเคราะห์ขององค์สามารถเชื่อมต่อเข้าไปยังคลังข้อมูลจากเครื่องคอมพิวเตอร์ของตนได้ ซึ่งการเชื่อต่อสามารถทำได้ทันทีตามความต้องการและด้วยประสิทธิภาพสูง เครื่องมือที่มีให้กับผู้จัดการและนักวิเคราะห์ใช้งานง่าย สามารถออกรายงานได้ด้วยการคลิกปุ่มเดียว
- ข้อมูลในคลังข้อมูลมีความถูกต้องตรงกันหมด คําถามเดียวกันต้องได้รับคำตอบที่เหมือนกันเสมอไม่ว่าผู้ถามจะเป็นใคร ถามเวลาใด
- ข้อมูลในคลังข้อมูลสามารถถูกวิเคราะห์จากหัวข้อในธุรกิจประเภทนั้น โดยแบ่งข้อมูลหรือรวมข้อมูลมาวิเคราะห์ตามความต้องการ
- คลังข้อมูลเป็นส่วนที่ผลิตข้อมูลจาก OLTP ข้อมูลไม่เพียงแต่ถูกรวบรวมมาไว้ที่ศูนย์กลางอย่างเดียว แต่จะถูกรวบรวมอย่างระมัดระวังจากแหล่งข้อมูลหลายๆ แห่งนอกองค์กรด้วย แล้วมาปรับปรุงให้เหมาะสมกับการใช้งานเท่านั้น ถ้าข้อมูลเชื่อถือไม่ได้หรือไม่สมบูรณ์จะไม่ถูกอนุญาตให้นำไปใช้
- คุณภาพของข้อมูลในคลังข้อมูลเป็นตัวผลักดันให้สามารถทําการ Re-engineering ธุรกิจได้
คุณสมบัติของคลังข้อมูล
7:45 PM
Posted by Nana
คุณสมบัติสำคัญของคลังข้อมูลที่แสดงให้เห็นถึงความแตกต่างจากฐานข้อมูลทั่วไป
ประกอบด้วย
1. Subject Oriented
2. Integrated
3. Time-Variant
4. Non-Volatile
1. Subject Oriented
คลังข้อมูลจะต้องถูกสร้างด้วยหัวข้อหลักทางธุรกิจที่องค์กรนั้นสนใจ
ตัวอย่างหัวข้อที่น่าสนใจของธุรกิจขายสินค้า เช่น ลูกค้า สินค้า ยอดขาย
อินวอยซ์ลูกค้า การควบคุมสต็อก และการขายสินค้า สิ่งเหล่านี้ล้วนสะท้อนในความต้องการจัดเก็บเพื่อใช้ในการสนับสนุนการตัดสินใจ
การวิเคราะห์ และดาต้าไมนิง (Data Mining)
ฐานข้อมูลระดับปฏิบัติการจะถูกออกแบบมาเพื่อใช้กับระบบงานแต่ละอย่าง
เช่นการขออนุมัติกู้เงิน การฝากเงิน สินเชื่อ
ซึ่งแตกต่างกับระบบคลังข้อมูลที่มีกรจัดกลุ่มตามหัวข้อหลักที่องค์กรสนใจ เช่น
ลูกค้า ผู้ขาย ผลิตภัณฑ์ เป็นต้น
2. Integrated
เป็นไปได้ว่าข้อมูลที่นำมาใช้ประกอบการตัดสินใจนั้น
สามารถได้มาจากแหล่งข้อมูลภายในและแหล่งข้อมูลภายนอก นั่นย่อมหมายถึงความแตกต่างในระบบ
รวมทั้งอาจมีการจัดเก็บข้อมูลในรูปแบบที่แตกต่างกัน หรือมาจากความแตกต่างของแพลตฟอร์ม
ดังนั้นระบบ Integrated จะต้องมีความสามารถในการรวมข้อมูลเหล่านั้นให้สอดคล้องหรือผสมผสานให้เป็นหนึ่งเดียวได้
ฐานข้อมูลระดับปฏิบัติการ
ต่างก็มีการออกแบบฐานข้อมูลที่แตกต่างกัน เช่นการอ้างอิงในรูปแบบวันที่ที่แตกต่างกัน
ซึ่งอาจจัดอยู่ในรูปแบบของ yymmdd, mmddyy หรือ mmddyyyy ดังนั้นระบบ Integrated จะต้องสามารถรวบรวมให้เป็นหนึ่งเดียวเพื่อให้ได้รูปแบบวันที่รูปแบบเดียวกัน
รวมถึงหน่วยวัดของผลิตภัณฑ์ที่อาจจะใช้หน่วยอ้างอิงที่แตกต่างกัน เช่น เซนติเมตร
นิ้ว หลา ดังนั้นระบบ Integrated จะต้องสามารถทำการแปลงหน่วยวัดเหล่านี้ให้เป็นหน่วยเดียวกันได้
3. Time-Variant
ข้อมูลในฐานข้อมูลเชิงปฏิบัติการมุ่งเน้นความเป็นปัจจุบัน
และจะต้องปรับปรุงให้ทันสมัยอยู่ตลอดเวลา แต่ข้อมูลในคลังข้อมูล
จะเป็นข้อมูลที่มีช่วงอายุในระยะเวลาใด เวลาหนึ่ง ซึ่งอาจจะเป็นตั้งแต่ 5 ถึง 10 ปี
แต่ทั้งนี้ก็ขึ้นอยู่กับความเหมาะสมเป็นหลักด้วย
การนำข้อมูลย้อนหลังที่เก็บรวบรวมไว้
ก็เพื่อนำมาวิเคราะห์เปรียบเทียบหาแนวโน้มและใช้พยากรณ์ทางธุรกิจ
4. Non-Volatile
เป็นที่เข้าใจแล้วว่าข้อมูลในคลังข้อมูลนั้นมีความแตกต่างจากฐานข้อมูลที่ใช้งานประจำวัน
ฐานข้อมูลประจำวัน มักมีการเพิ่ม ลบ
หรือปรับปรุงข้อมูลเพื่อให้ทันสมัยอยู่ตลอดเวลา
ในขณะที่คลังข้อมูลมีวัตถุประสงค์เพื่อให้ผู้ใช้เข้าถึงเพื่อนำมาวิเคราะห์เท่านั้น
ในการรับปรุงข้อมูลในคลังข้อมูลนั้นถือเป็นเรื่องใหญ่มาก เพราะรูปแบบการเก็บข้อมูลในคลังข้อมูล
มุ่งเน้นประสิทธิภาพด้านการเรียกใช้ข้อมูลที่มีความรวดเร็วสูงเป็นสำคัญ
มากกว่าพิจารณาความซ้ำซ้อนของข้อมูล อย่างไรก็ตาม
หากมีความจำเป็นต้องแก้ไขหรือปรับปรุง
จะต้องเป็นวิธีที่ไม่ส่งผลกระทบต่อบานข้อมูลในคลัง เช่น การบันทึกช่วยจำ
หรือการสร้างตัวแปรใหม่ เป็นต้น
คลังข้อมูล
7:44 PM
Posted by Nana
แนวโน้มการพัฒนาเทคโนโลยีฐานข้อมูลเป็นไปอย่างไม่หยุดนิ่ง
องค์กรธุรกิจต่างก็เห็นพ้องต้องกันในความสำคัญของฐานข้อมูล จึงมีการจัดเก็บฐานข้อมูลขององค์กรไว้เพื่อใช้งาน
แต่การนำเสนอข้อมูลต่างๆ จากฐานข้อมูลใช่ว่าจะมีเพียงแค่รายงานประจำวัน
รายงานสรุปผล แต่ได้รวมถึงเทคโนโลยีด้านระบบฐานข้อมูลที่มีรวบรวมข้อมูลขนาดใหญ่มาก
เพื่อนำไปใช้ช่วยในการประกอบการตัดสินใจ
ข้อมูลที่ใช้อยู่ในปัจจุบันเรียกว่าฐานข้อมูลเชิงปฏิบัติการ
(Operational Database) แต่ละวันจะมีปริมาณข้อมูลชนิดนี้เพิ่มขึ้นเรื่อยๆ
ครั้นเมื่อมีการจัดเก็บข้อมูลประเภทนี้มากขึ้น
ข้อมูลย้อนหลังเหล่านี้จึงจำเป็นต้องนำแยกเก็บไว้บนสื่อบันทึกข้อมูลต่างหาก เช่น
เทป ดิสเก็ตต์ความจุสูง หรือแผ่นซีดี เป็นต้น
สาเหตุที่ต้องนำข้อมูลเหล่านี้มาแยกไว้บนสื่อเก็บข้อมูลต่างหาก ก็เพราะว่าหากนำข้อมูลเหลานั้นมาประมวลผล
ก็จะต้องใช้เวลานาน เนื่องจากมีปริมาณข้อมูลจำนวนมาก
และอาจจะส่งผลกระทบต่อระบบงานประจำวันที่ดำเนินการอยู่ได้
ดังนั้นจึงมีแนวคิดเรื่องคลังข้อมูล (Data
Warehouse) เพื่อตอบสนองในรูปแบบของคลังที่ไว้สำหรับเก็บข้อมูลดังกล่าวที่นับวันจะเพิ่มขึ้นทุกขณะมาใช้สำหรับการบริหาร
และที่สำคัญสามารถนำข้อมูลเหล่านี้มาใช้เพื่อประกอบการตัดสินใจของผู้บริหารได้
เช่น บริษัทแห่งหนึ่ง มีใบกำกับสินค้าที่จัดเป็นหนึ่งในข้อมูลพื้นฐานของธุรกิจ
ที่มีรายละเอียดสำคัญๆ ไว้ เช่น ข้อมูลของลูกค้า
รายการสินค้า วันที่ซื้อ และจำนวนเงิน
แต่เมื่อมีการรวบรวมใบกำกับสินค้าดังกล่าวไว้เป็นข้อมูลพื้นฐานเพื่อใช้ในการวิเคราะห์ข้อมูลต่างๆ
ของผลิตภัณฑ์ของทางบริษัท เช่น การนำข้อมูลดังกล่าว มาใช้ในการพัฒนาผลิตภัณฑ์ใหม่ๆ
การสร้างมุมมองระหว่างผลิตภัณฑ์กับลูกค้า
รวมถึงการเพิ่มยอดขายให้สูงขึ้น
ซึ่งล้วนแต่เป็นสิ่งที่ผู้บริหารต้องการทั้งสิ้น
แต่แหล่งที่เก็บข้อมูลของคลังข้อมูล
นับวันจะมีปริมาณที่สูงขึ้นถึงขนาดความจุเทอราไบต์
จึงจำเป็นต้องมีเครื่องมือหรือซอฟต์แวร์เพื่อจัดการกับฐานข้อมูลขนาดใหญ่นี้โดยเฉพาะ
นั่นคือเหตุผลที่ระบบคลังข้อมูลจำเป็นต้องแยกจากระบบงานประจำวันที่ดำเนินการอยู่
เพราะหากนำระบบนี้มาใช้ร่วมกันจะส่งผลต่อระบบโดยรวม
และจะทำให้การประมวลผลการดำเนินธุรกรรมประจำวันเป็นไปด้วยความล่าช้า
คลังข้อมูลที่ดี
จำเป็นต้องได้รับการจัดการหรือบริหารจัดการที่ดี หลายๆ
องค์กรได้นำระบบคลังข้อมูลมาใช้ ซึ่งเป็นที่เข้าใจว่า จำเป็นต้องใช้เงินลงทุนจำนวนมหาศาล
แต่ท้ายสุดก็ไม่สามารถบรรลุผลสำเร็จได้ตามวัตถุประสงค์
เนื่องจากขาดการบริหารจัดการข้อมูลในคลังข้อมูล รวมถึงผู้ที่รับผิดชอบงานดังกล่าวจำเป็นต้องมีความรู้และประสบการณ์ที่ดีพอ
จากข้อมูลที่กล่าวมาข้างต้นนั้น จึงสามารถนิยามความหมายของคลังข้อมูลได้ว่า
คลังข้อมูลคือแหล่งจัดเก็บข้อมูลขององค์กรที่ได้รับการออกแบบมาเพื่อใช้สำหรับการวิเคราะห์และตัดสินใจ
โดยสนับสนุนการนำข้อมูลทั้งจากแหล่งภายในและแหล่งภายนอกมาประมวลผลร่วมกันได้
ซึ่งข้อมูลที่นำมาประมวลผลจะเป็นข้อมูลย้อนหลังหรือเป็นข้อมูลในอดีตที่จัดเก็บในหลายช่วงเวลา
เป็นข้อมูลที่ไม่มีการเคลื่อนไหว แต่อาจจะปรับเพิ่มความเหมาะสมก่อนที่จะนำเข้าไปเก็บในคลัง
และมักสกัดหรือคัดเลือกจัดเก็บเฉพาะข้อมูลที่จำเป็นต่อการใช้งานเท่านั้น โดยข้อมูลที่เป็นขยะไม่สามารถนำมาใช้ประโยชน์ได้จะไม่นำไปเก็บในคลังข้อมูล
ทั้งนี้ข้อมูลที่เก็บในคลังจะเก็บในรูปแบบของฐานข้อมูลเชิงสัมพันธ์