Friday, June 12, 2015
Tuesday, June 9, 2015
องค์ประกอบของคลังข้อมูล
8:00 PM
Posted by Nana
คลังข้อมูลอาจจะมีข้อมูลเป็นจํานวนมากมายมหาศาล
ดังนั้นจึงจําเป็นต้องมีฐานข้อมูลของตนเองในการเก็บและประมวลผลข้อมูล หน่วยงานต้องมีโปรแกรมจัดการฐานข้อมูลและโปรแกรมอื่นๆ
สําหรับช่วยในการเปลี่ยนรูปแบบข้อมูล จัดกลุ่มข้อมูล รวมข้อมูล และโยกย้ายข้อมูลจากฐานข้อมูลหนึ่งไปยังฐานอื่นๆ โปรแกรมเหล่านี้ต้องทำงานได้ทั้งกับข้อมูลที่เป็นจํานวน ข้อมูลกราฟิก ข้อมูลภาพลักษ์ และ ข้อมูลแบบมัลติมีเดียโปรแกรมเหล่านี้จะต้องสามารถแปลงข้อมูลให้เหมาะสมที่จะนําไปวิเคราะห์ และจัดทํารายงานในรูปแบบต่างๆ ได้
โดยที่คลังข้อมูลมีบริการสำคัญหลายอย่างให้แก่ผู้ใช้งานอาจจะไม่ใช่ผู้เชี่ยวชาญในด้านคอมพิวเตอร์ดังนั้นการจัดคลังข้อมูลจึงจำเป็นต้องจัดการฝึกอบรมให้แก่ผู้ใช้ด้วย นอกจากนั้นยังอาจจะต้องจัดระบบอธิบายการใช้เอาไว้ในระบบด้วยเพื่อให้ผู้ใช้สามารถเรียกคําอธิบายมาใช้เมื่อต้องการได้ ส่วนประกอบสำคัญอีกอย่างหนึ่งก็คือที่ปรึกษาเกี่ยวกับคลังข้อมูลเพื่อช่วยเหลือผู้ใช้ให้สามารถใช้ระบบได้อย่างมีประสิทธิภาพมากขึ้น
ส่วนประกอบของคลังข้อมูลมีดังนี้
1. เครื่องมือสกัดแยก ข้อมูล
2. ข้อมูลที่สกัดและแยกออกมาแล้ว
3. เมตาเดตา (Meta-Data) สําหรับบรรยายเนื้อหา ข้อมูล
4. ฐานข้อมูลสําหรับคลัง ข้อมูล
5. เครื่องมือจัดการข้อมูลในคลัง ข้อมูล
6. โปรแกรมสําหรับจัดส่ง ข้อมูล
7. เครื่องมือวิเคราะห์สําหรับผู้ใช้
8. วัสดุและหลักสูตรการฝึกอบรม
9. ที่ปรึกษาด้านคลัง ข้อมูล
สถาปัตยกรรมคลังข้อมูล
7:57 PM
Posted by Nana
เนื้อหาในส่วนข้อจะกล่าวถึงภาพรวมของสถาปัตยกรรมและองค์ประกอบหลักของคลังข้อมูล
ซึ่งประกอบด้วยกระบวนการ เครื่องมือ และเทคโนโลยีที่มีความสัมพันธ์กับคลังข้อมูล
ดังนี้
1. ข้อมูลปฏิบัติการ (Operational Data)
ข้อมูลระดับปฏิบัติการที่จะนำไปเก็บบันทึกในคลังข้อมูล
สามารถได้จาก
- ข้อมูลปฏิบัติการที่บันทึกอยู่ในเครื่องคอมพิวเตอร์เมนเฟรม
ซึ่งเป็นข้อมูลในยุคแรกที่มีรูปแบบเป็นฐานข้อมูลแบบลำดับชั้น หรือแบบเครือข่าย
- ข้อมูลในระดับแผนก
ซึ่งจัดเก็บในรูปแบบของระบบแฟ้มข้อมูล เช่น VSAM, RMS รวมถึงข้อมูลที่อยู่ในรูปแบบของฐานข้อมูลเชิงสัมพันธ์
เช่น Informix, ORACLE เป็นต้น
- ข้อมูลส่วนตัวที่บรรจุอยู่ในเวิร์กสเตชันหรือเวิร์ฟเวอร์ส่วนตัว
- แหล่งข้อมูลจากภายนอก เช่น อินเทอร์เน็ต
ฐานข้อมูลการดำเนินงานทางธุรกิจ
หรือฐานข้อมูลที่เกี่ยวข้องกับข้อมูลตัวแทนจำหน่ายหรือลูกค้า
นอกจากนี้ยังรวมถึงสื่อจัดเก็บข้อมูลปฏิบัติการ (Operational
Data Store; ODS) ที่เป็นแหล่งรวมของข้อมูลปฏิบัติการปัจจุบันที่ได้รับการปรับลูกแบบโครงสร้างแล้ว
รวมถึงการสัดข้อมูลจากแหล่งข้อมูลให้คงไว้ซึ่งข้อมูลที่จำเป้นต่อการนำไปวิเคราะห์ในคลัง
2. ผู้จัดการงานโหลดข้อมูล (Load Manager)
ผุ้จัดการงานโหลดข้อมูลเป็นผู้ที่ทำหน้าที่เกี่ยวกับการเตรียมข้อมูล
ก่อนนำเข้าไปเก็บไว้ในคลัง ซึ่งถือเป็นงานส่วนหน้า (Frontedn) ที่ปฏิบัติงานด้านคัดกรองข้อมูลเพื่อโหลดข้อมูลเข้าไปในคลัง
การปฏิบัติงานในส่วนนี้เกี่ยวข้องกับการแปลงข้อมูลให้อยู่ในรูปแบบมาตรฐานก่อนส่งเข้าไปในคลัง
ขนาดและความซับซ้อนของานส่วนนี้จะเกี่ยวข้องกับคลังข้อมูลและแหล่งข้อมูลที่มาจากต่างผลิตภัณฑ์
ดังนั้นผู้จัดการส่วนนี้ต้องใช้เครื่องมือ หรืออาจสร้างโปรแกรมขึ้นมาใช้เอง
เพื่อทำการรวมข้อมูลต่างๆ ที่มาจากต่างผลิตภัณฑ์
3. ผู้จัดการคลัง (Warehouse Manager)
ผู้จัดการคลังเป็นบุคคลที่ทำหน้าที่ดำเนินการเกี่ยวกับระบบปฏิบัติการ
ด้านการจัดการคลังข้อมูลในคลังทั้งหมด ด้วยการนำเครื่องมือการจัดการข้อมูลต่างๆ
ของผลิตภัณฑ์ ซึ่งงานของผู้จัดการคลังข้อมูลประกอบด้วย
- วิเคราะห์ข้อมูล
เพื่อให้เกิดความมั่นใจถึงความสอดคล้องตรงกันของข้อมูล
- แปลงและรวมข้อมูลจากแหล่งข้อมูลลงสู่ตารางคลังข้อมูล
- สร้างดัชนีและวิวของตารางต่างๆ
- ดำเนินการนอร์มัลไลเวชัน ถ้าจำเป็น
- นำข้อมูลมารวมกัน ถ้าจำเป็น
- สำรองข้อมูลที่สำคัญ
4. ผู้จัดการคิวรี
ผู้จัดการคิวรีเป็นงานส่วนหลัง (backend) ที่มีหน้าที่ดำเนินการเกี่ยวกับการปฏิบัติงานด้านการจัดการยูสเซอร์คิวรี
ในส่วนนี้จะต้องทำการสร้างคิวรีด้วยเครื่องมือของผลิตภัณฑ์นั้นๆ
เพื่อให้สามารถเข้าถึงข้อมูล ตรวจสอบคลังข้อมูล ความสะดวกในการใช้งานฐานข้อมูล
และการสร้างโปรแกรมขึ้นเพื่อใช้งาน ในบางครั้งผู้จัดการคิวรีอาจจำเป็นต้องสร้าง Query
Profile เพื่ออนุญาตให้ผู้จัดการคลังข้อมูลในการกำหนดดัชนีและการรวมข้อมูลตามความเหมาะสม
5. ข้อมูลรายละเอียด (Detailed Data)
พื้นที่ของคลังข้อมูลส่วนนี้จะจัดเก็บข้อมูลรายละเอียดทั้งหมดในโครงร่างฐานข้อมูล
โดยข้อมูลรายละเอียดส่วนนี้จะถูกรวบรวมเพื่อส่งไปยังลำดับถัดไป
6. ข้อมูลสรุปผลโดยคร่าวและข้อมูลสรุปขั้นสูง (Lightly
and Highly Summarized Data)
พื้นที่คลังส่วนนี้จะจัดเก็บข้อมูลสรุปคร่าวๆ
และข้อมูลสรุปขั้นสูงที่ถูกสร้างโดยผู้จัดการคลัง
โดยพื้นที่ส่วนนี้จะเป็นพื้นที่ชั่วคราวในคลังเพื่อการเปลี่ยนแปลงหัวข้อ
และตอบสนองงานคิวรีที่อาจเปลี่ยนแปลงไปตามความต้องการ
จุดประสงค์ของสารสนเทศที่สรุปผลมานั้นก็เพื่อเพิ่มความเร็วในการประมวลผลของคิวรี
ถึงแม้ว่าในส่วนงานนี้ต้องเพิ่มภาระงานด้านสรุปผลข้อมูล
ด้วยการขจัดข้อมูลที่ไม่จำเป็นออกไปโดยจัดเก็บเฉพาะข้อมูลที่เป็นผลสรุป
ทั้งนี้เพื่อการตอบคำถามให้แต่ผู้ใช้ได้
โดยข้อมูลสรุปเหล่านี้จะมีการปรับปรุงทุกครั้งเมื่อมีข้อมูลใหม่โหลดเข้ามาในครั้ง
7. การสำรองข้อมูล (Archiver/Backup Data)
ถึงแม้ว่าข้อมูลสรุปผลจะถูกสร้างมาจากข้อมูลรายละเอียด
แต่ก็มีวคามจำเป็นต้องสำรองเก็บไว้บนสื่อบันทึกข้อมูลออนไลน์
หรืออาจย้ายข้อมูลเหล่านี้ไปเก็บไว้ในเทปแม่เหล็กหรือออปติคัลดิสก์
8. ข้อมูลที่ใช้อธิบายข้อมูล (Meta-Data)
เนื่องจากข้อมูลในคลังข้อมูลจะนำไปใช้ในการวิเคราะห์ตามหัวข้อธุรกิจที่ผู้ใช้สนใจ
ดังนั้นจึงจำเป็นต้องมีเครื่องมือที่ใช้สำหรับแยกข้อมูลตามรายละเอียด ซึ่งก้คือ Meta-Data
ที่จัดเป็นเครื่องมือหนึ่งที่ใช้อธิบายข้อมูลของข้อมูลนั่นเอง
กล่าวคือ เป็นรายละเอียดเกี่ยวกับข้อมูลที่จัดเก็บในคลัง
เพื่อใช้ในการตอบคำถามบางอย่าง เช่น ข้อมูลนี้มาจากที่ใด ระบบใด
มีรูปแบบข้อมูลแบบใด มีขัดจำกัดในการใช้งานอย่างไรบ้าง ถูกปรับปรุงครั้งล่าสุดเมื่อใด
และมีรูปแบบที่กำหนดไว้อย่างไรในฐานข้อมูล เป็นต้น ดังนั้น Meta-Data จึงเป็นรายละเอียดที่สำคัญมาก
เพื่อที่จะได้สามารถนำข้อมูลที่มีรายละเอียดที่ถูกต้องมาวิเคราะห์
9. เครื่องมือการเข้าถึงข้อมูลของผู้ใช้
(End-User Access Tools)
เครื่องมือการเข้าถึงข้อมูลสำหรับผู้ใช้เป็นส่วนที่เกี่ยวข้องกับเครื่องมือต่างๆ
ที่ผู้ใช้นำไปใช้งานเพื่อโต้ตอบกับคลังข้อมูล คลังข้อมูลต้องสนับสนุนวิธีการทาง Ad
Hoc และการวิเคราะหืงานประจำ โดยมีเครื่องมือต่างๆ
ที่ประกอบด้วยสิ่งเหล่านี้
-
เครื่องมือการสร้างรายงานและคิวรี
-
เครื่องมือการสร้างแอผพลิเคชัน
-
เครื่องมือระบบสารสนเทศสำหรับผู้บริหารระดับสูง
-
เครื่องมือการประมวลผล OLAP
-
เครื่องมือ Data Mining
ความสัมพันธ์ระบบคลังข้อมูลและระบบฐานข้อมูล
7:54 PM
Posted by Nana
ในปัจจุบันมีการใช้งานฐาานข้อมูลอย่างกว้างขวางในระบบงาานทั่วไป จึงมีการวิจัยและพัฒนาวิธีเก็บข้อมูลจำนวนมาก รวมถึงการค้นหาและนำข้อมูลที่ต้องการออกมาจากระบบฐานข้อมูลด้วย แต่เนื่องจากระบบฐานข้อมูลทั่วไปที่นิยมใช้อยู่ในปัจจุบันมีหลักในการเก็บข้อมูลที่เน้นในเรื่องการลดความซ้ำซ้อน รักษาความถูกต้อง ลดการสูญหายของข้อมูล และลดความผิดพลาดที่เกิดขึ้นจากการแก้ไขข้อมูล
เนื่องจากฐานข้อมูลทั่วไป มีลักษณะดังได้กล่าวมาแล้ว จึงมีความสามารถเพียงแค่การเรียกใช้ข้อมูลที่มีอยู่ แต่ไม่สามารถจะนำมาช่วยในการสนับสนุนการตัดสินใจได้ เพราะเมื่อมีการเรียกใช้ข้อมูลจะต้องเรียกใช้ข้อมูลจากฐานข้อมูลขนาดใหญ่ ซึ่งมีข้อมูลจำนวนมหาศาลและมีการแตกตารางที่นอร์มัลไลซ์แล้วออกเป็นหลายๆ ตาราง จึงไม่รองรับคำถามที่ต้องการจะนำมาใช้ในการสนับสนุนการตัดสินใจ มรการรวมกันของตารางต่างๆ ที่ซับซ้อน ซึ่งจะทำให้ประสิทธิภาพของการค้นหาข้อมูลจากบานข้อมูลน้อยลง และทำงานช้าลง ไม่สามารถเรียกใช้ข้อมูลที่ต้องการได้ทั้งหมดเพราะมีรูทีนอัตโนมัติ จึงมีวคามสามารถในกาารค้นหาข้อมูลที่ไม่ซ้ำซ้อนเท่านั้น นอกจากนี้การเก็บข้อมูลในระบบฐานข้อมูลทั่วไป ยังไม่มีการเก็บข้อมูลย้อนหลัง เพื่อใช้ช่วยในการคาดคะเนแนวโน้มที่คาดว่าจะเป็นไปได้ในอนาคต
เนื่องจากฐานข้อมูลทั่วไป มีลักษณะดังได้กล่าวมาแล้ว จึงมีความสามารถเพียงแค่การเรียกใช้ข้อมูลที่มีอยู่ แต่ไม่สามารถจะนำมาช่วยในการสนับสนุนการตัดสินใจได้ เพราะเมื่อมีการเรียกใช้ข้อมูลจะต้องเรียกใช้ข้อมูลจากฐานข้อมูลขนาดใหญ่ ซึ่งมีข้อมูลจำนวนมหาศาลและมีการแตกตารางที่นอร์มัลไลซ์แล้วออกเป็นหลายๆ ตาราง จึงไม่รองรับคำถามที่ต้องการจะนำมาใช้ในการสนับสนุนการตัดสินใจ มรการรวมกันของตารางต่างๆ ที่ซับซ้อน ซึ่งจะทำให้ประสิทธิภาพของการค้นหาข้อมูลจากบานข้อมูลน้อยลง และทำงานช้าลง ไม่สามารถเรียกใช้ข้อมูลที่ต้องการได้ทั้งหมดเพราะมีรูทีนอัตโนมัติ จึงมีวคามสามารถในกาารค้นหาข้อมูลที่ไม่ซ้ำซ้อนเท่านั้น นอกจากนี้การเก็บข้อมูลในระบบฐานข้อมูลทั่วไป ยังไม่มีการเก็บข้อมูลย้อนหลัง เพื่อใช้ช่วยในการคาดคะเนแนวโน้มที่คาดว่าจะเป็นไปได้ในอนาคต
โดยระบบคลังข้อมูลจะแยกกลุ่มข้อมูลสารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้ประจำวัน มาเก็บอยู่ในระบบฐานข้อมูล RDBMS ทำให้การเรียกใช้ข้อมูลชุดนี้ทำได้อย่างยืดหยุ่น จากเครื่องมือที่อยู่บนเครื่องคอมพิวเตอร์เดสก์ทอปทั่วไป โดยลด off-loading เพื่อเพิ่มกลไกช่วยตัดสินใจ ปรับปรุงเวลาที่ตอบสนองให้รวดเร็วขึ้นอย่างมาก และผู้บริหารสามรถเรียกข้อมูลรายละเอียดที่จำเป็นที่ถูกเก็บมาก่อนหน้านี้ มาช่วยในการตัดสินใจในทางธุรกิจแม่นยำขึ้น
ความแตกต่างอีกประการหนึ่งคือผู้ใช้คลังข้อมูลมักจะต้องจัดการกลุ่มข้อมูลด้วยตนเองมากกว่าผู้ใช้ฐานข้อมูลธรรมดา ยกตัวอย่างผู้ใช้อาจต้องวิเคราะห์ผลกระทบของการทำการตลาดแบบต่างๆ หรือต้องการจัดกลุ่มการขายสินค้าแยกตามผลิตภัณฑ์ หรือรูปแบบของการจัดผลิตภัณฑ์ เช่น การห่อรวมสินค้าไว้ในบรรจุภัณฑ์สีต่างๆ หรือการรวมผลิตภัณฑ์ต่างรูปแบบไว้ด้วยกัน
นอกจากาการรวมข้อมูลเข้ามารวมกันแล้ว ทผู้ใช้ยังอาจต้องการที่จะแยกแยะข้อมูลในแบบที่ตนต้องการได้ ยกตัวอย่างในการจัดทำคลังข้อมูลเกี่ยวกับนักวิจัยและผลงานวิจัยของผระเทศ หน่วยงานอาจจะเก็บข้อมูลไว้เป็นกลุ่มก้อนโดยไม่ได้แยกสาขา แต่ต่อมาผู้ใช้อาจจะต้องการนำข้อมูลนักวิจัยมาวิเคราะห์แยกแยะว่าทั้งประเทศมีนักวิจัยสาขาต่างๆ เป็นตชจำนวนเท่าใด ทำงานวิจัยด้านใดบ้าง ใช้เงินด้านวิจัยไปเท่าใดบ้าง เป็นต้น โดยปกติแล้วการจัดทำฐานข้อมูลให้สามารถวิเคราะห์ แยกแยะข้อมูลในแบบนี้ได้นั้นเป็นเรื่องไม่ยาก แต่ในการออกแบบคลังข้อมูลนั้นจำเป็นต้องเผื่อให้ผู้ใช้หลายคนสามารถแยกแยะข้อมูลตามความต้องการที่แตกต่างกันได้ด้วยผู้ใช้จำนวนมากในปัจจุบันนี้อาจใช้ซอฟต์แวร์หลากหลายประเภทสำหรับเครื่องคอมพิวเตอร์ส่วนบุคคล ผู้ใช้บางคนอาจใช้โปรแกรมสเปรดชีสในการวิเคราะห์ข้อมูล และผู้ใช้บางคนอาจต้องการใช้โปรแกรมวิเคราะห์สถิติอื่นๆ ดังนั้นผู้ใช้เหล่านี้อาจจะต้องมีความต้องการในการนำเข้าข้อมูลจากคลังข้อมูลมาไว้ในแฟ้มข้อมูลที่มีรูปแบบตรงกับโปรแกรมที่ตนต้องการใช้ ความต้องการด้านนี้นับว่าสำคัญมากที่สุดในการจัดทำคลังข้อมูล
งานอย่างหนึ่งที่นิยมใช้บานข้อมูลกันมาก คืองานบันทึกข้อมูลธุรกรรมเอาไว้เพื่อประมวลผลข้อมูลธุรกรรมเหล่านี้ได้แก่ ข้อมูลการสั่งซื้อสินค้าของลูกค้า ข้อมูลการซื้อบัตรโดยสารเครื่่องบิน ข้อมูลการฝากหรือถอนเงินของลูกค้าธนาคาร แต่เดินนั้นการบันทึกข้อมูลธุรกรรมเริ่มต้นด้วยการใช้กระดาษแบบฟอร์มสำหรับให้ลูกค้ากรอกข้อมูล ดังนั้นจึงนำแบบฟอร์มมาบันทึกข้อมูลลงในฐานข้อมูลระบบคอมพิเตอร์ในระบบ Batch แต่นปัจจุบันนี้การบันทึกธุรกรรมได้เปลี่ยนไปเป็นระบบ Online เป็นส่วนใหญ่ ในระบบแบบนี้กระบวนการบันทึกข้อมูลมีลักษระอัตโนมัติมากขึ้นและใช้อุปกรณ์บันทึกข้อมูลที่สามารถเก็บข้อมูลลงในฐานข้อมูลของคอมพิวเตอรืได้ทันที เช่น การใช้อุปกรณ์ฝากถอนเงินโดยอัตโนมัติ (ATM) ทำให้สามารถประมวลผลการฝากถอนเงินได้ทันที เป็นต้น
สถาปัตยกรรมและองค์ประกอบของคลังข้อมูล
7:52 PM
Posted by Nana
ข้อมูลที่เอามาใช้ในการตัดสินใจ จะถุกรวบรวมไว้ซึ่งอาจอยู่ในรูปแบบที่แตกต่างกัน เช่นในรูปแบบของแฟ้มข้อมูล หรือฐานข้อมูล ดังนั้นจึงจำเป็นต้องนำข้อมูลเหล่านี้มาผ่านกระบวนการแปลงข้อมูลให้อยู่ในมาตรฐานเดียวกัน เทคโนโลยีระบบคลังข้อมูลจะประกอบไปด้วย 3 ส่วนหลัก คือ Data Extraction Tool, Database และ Analysis Tool โดยที่ Data Extraction Tool ใช้ดึงข้อมูลที่สนใจเพื่อการวิเคราะห์จากต้นทางและทำการแปลงข้อมูลก่อนเก็บข้อมูลไว้ในระบบฐานข้อมูล เพื่อใช้ Analysis Tool มาวิเคราะห์ข้อมูลอีกทีหนึ่ง ดังนั้นระบบฐานข้อมูลจึงเป็นแหลงเก็บข้อมูลที่สนใจและคัดเลือกแล้วเพื่อใช้ในการวิเคราะห์ระบบคลังข้อมูล
ประโยชน์ของระบบคลังข้อมูล
7:52 PM
Posted by Nana
โดยทั่วไปแล้วข้อมูล Operational Database จะเก็บข้อมูลในรูปแบบ Transaction Systems เมื่อมีความต้องการข้อมูลในอันที่จะนํามาใช้ช่วยในการตัดสินใจก็จะประสบปัญหาต่างๆ
เช่น
- บุคลากรทางด้าน Information Systems จำเป็นต้องเรียกข้อมูลจากฐานข้อมูลขนาดใหญ่ ซึ่งมีข้อมูลมากเกินความต้องการ ส่งผลให้ประสิทธิภาพของ Transaction Operational Database ทำงานได้ช้าลง
- ข้อมูลจะเป็นรูปแบบข้อมูลตารางเท่านั้น
- ข้อมูลจะถูกนำเสนอในรูปแบบที่ตายตัว ไม่สามารถเปลี่ยนแปลงตามความต้องการของผู้ใช้
- ไม่ตอบสนองความต้องการของการตัดสินใจ เพราะข้อมูลสําหรับการตัดสินใจมีความสลับซับซ้อนสูง มีการรวมตัวกันของข้อมูลจากตารางต่างๆ หลายๆ ตารางข้อมูล
- ไม่ตอบสนองการสอบถามข้อมูล (Data Queries) สําหรับผู้ใช้
- มีข้อมูลย้อนหลังน้อย (Historical Data)
- ข้อมูลถูกจัดเก็บกระจัดกระจายตามที่ต่างๆ ซึ่งยากต่อการเรียกใช้หรือขาดความสัมพันธ์ทางธุรกิจอันอาจจะต้องเสียเวลาในการทําให้สอดคล้อง หรือเกิดความซ้ำซ้อนของข้อมูลได้
จากอุปสรรคที่กล่าวมาข้างต้นคลังข้อมูลจึงได้ถูกออกแบบมาเพื่อตอบสนองงานในรูปแบบการตัดสินใจโดยการแยกฐานข้อมูลออกจาก
Operational Database และเก็บข้อมูลในรูปแบบข้อมูลสรุป (Summary Data) ซึ่งข้อมูลสรุปนี้จะเลือกแต่เฉพาะข้อมูลที่มีความสําคัญต่อการตัดสินใจหรือเพื่อใช้ในการบริหารไปจนถึงการกําหนดแผนงานในอนาคต
ในระบบคลังข้อมูล ข้อมูลที่ซับซ้อนจะถูกรวบรวมหรือเปลี่ยนแปลงให้ง่ายต่อการจัดเก็บและสามารถเรียกกลับมาใช้ได้อย่างรวดเร็วและถูกต้อง โดยข้อมูลต่างๆ เหล่านี้จะถูกนํามาใช้สำหรับการวิเคราะห์และช่วยในเรื่องการตัดสินใจโดยอาศัยเครื่องมือ
(Tool) ที่อยู่ในเครื่องคอมพิวเตอร์ที่เป็น ซอฟต์แวร์มาใช้ในการจัดการทำรายงานและเพิ่มประสิทธิภาพสำหรับการตัดสินใจให้รวดเร็วยิ่งขึ้น โดยผู้บริหาร นักวางแผน และนักวิเคราะห์ข้อมูลสามารถเรียกหาข้อมูลหรือสอบถาม (Query)
เพื่อให้ได้รับคําตอบในรูปแบบตารางรายงาน หรือรายงาน
กราฟเพื่อมาทําการวิเคราะห์ข้อมูลลด้วยตนเองเช่น
- การเปรียบเทียบยอดขายระหว่างช่วงเวลาในอดีตกับปัจจุบันไปจนถึงการทําพยากรณ์ยอดขายในอดีต (Forecasting)
- การหายอดขายสูงสุดหรือตํ่าสุด
- การเปรียบเทียบยอดขาย ต้นทุน กําไร ในรูปแบบตารางรายงาน หรือรายงาน กราฟ
ซึ่งเครื่องมือนี้ถือได้ว่าเป็นสิ่งสำคัญในอันที่จะนําองค์กรไปสู่ความสําเร็จในกระบวนการตัดสินใจ ในปัจจุบันเครื่องมือที่ตอบสนองงานเพื่อช่วยผู้บริหารสำหรับการตัดสินใจมีอยู่มากมายในตลาด ทั้งนี้ก็เป็นทางเลือกของผู้ใช้ในการที่จะเลือกเครื่องมือที่มีประสิทธิภาพสูงสุดเพื่อตอบสนองงานของผู้บริหารในกระบวนการตัดสินใจต่อไป
จะเห็นได้ว่าการจัดทําคลังข้อมูลเป็นความท้าทายอย่างหนึ่งของหน่วยงาน
ทั้งนี้พราะหน่วยงานต่างๆ มักจะมีข้อมูลธุรกรรมที่ไม่มีความต้องกัน (Consistent)
และมีความลักลั่นอยู่มากดังได้อธิบายไปบ้างแล้ว ดังนั้นการจัดทําคลังข้อมูลจะต้องหาทางแก้ปัญหานี้ให้ได้ อีกประการหนึ่งก็คือข้อมูลบางส่วนหายไปหรือมีไม่ครบ
ยกตัวอย่างบริษัทแห่งหนึ่งต้องการวิเคราะห์ความสนใจของลูกค้าที่ใช้บัตรสมาชิกที่บริษัทออกให้ โดยกำหนดจะแยกความสนใจว่ามีความแตกต่างระหว่างเพศหรือไม่ แต่ในการจัดทำระบบประมวลผลธุรกรรมตั้งแต่แรกนั้นนักวิเคราะห์ระบบไม่ได้กําหนดให้เก็บข้อมูลเพศของลูกค้าเอาไว้เพราะเห็นว่าไม่เกี่ยวกับธุรกรรม ดังนั้นผู้ใช้จึงไม่สามารถนําข้อมูลมาวิเคราะห์ได้ ในกรณ์เช่นนี้ระหว่างการจัดทําคลังข้อมูลก็จะต้องจัดให้มีพนักงานที่ทําหน้าที่ศึกษาข้อมูลโดยพิจารณาจากแบบฟอร์มเดิมแล้วนํามาบันทึกเป็นข้อมูลเพิ่มเติมขึ้น
การจัดทําคลังข้อมูลจะมีความสําคัญมากขึ้นในอนาคต เพราะปัจจุบันนี้ผู้ใช้และผู้บริหารของหน่วยงานเริ่มมีเข้าใจความสำคัญของข้อมูลมากขึ้น และเริ่มตระหนักว่าหากนำข้อมูลมาวิเคราะห์ให้เข้าใจสถานภาพหรือเหตุการณ์ ที่เกิดขึ้นแล้วจะทําให้หน่วยงานหรือบริษัทสามารถตอบสนองต่อเหตุการณ์ที่เกิดขึ้นได้ดียิ่งขึ้นและจะทำให้หน่วยงานหรือบริษัททำงานบรรลุวัตถุประสงค์และเป้าหมายได้ดียิ่งขึ้นตามไปด้วย
วัตถุประสงค์ของการสร้างคลังข้อมูล
7:46 PM
Posted by Nana
เป้าหมายของการสร้างคลังข้อมูลคือ การแยกกลุ่มข้อมูลสารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้งานประจำวัน
(Operational Database) มาเก็บอยู่ใน Relational
Database Management Systems (RDBMS) ประสิทธิภาพสูง และทำให้การเรียกใช้ข้อมูลชุดนี้ทำได้อย่างยืดหยุ่น
จากเครื่องมือที่อยู่บนเครื่องเดสก์ทอปทั่ไป
โดยลด Off-loading เพิ่มกลไกการช่วยตัดสินใจ ปรับปรุงเวลาที่ตอบสนอง (Response time) รวดเร็วยิ่งขึ้นอย่างมากและผู้บริหารสามารถเรียกข้อมูลรายละเอียดที่จำเป็น ที่ถูกเก็บมาก่อนหน้านี้ (Historical
Data) มาใช้ช่วยในการตัดสินใจทางธุรกิจแม่นยำขึ้น
เป้าหมายในการสร้างคลังข้อมูลมีดังนี้
- คลังข้อมูลทําให้สามารถเข้าถึงข้อมูลขององค์กรได้ ผู้จัดการและนักวิเคราะห์ขององค์สามารถเชื่อมต่อเข้าไปยังคลังข้อมูลจากเครื่องคอมพิวเตอร์ของตนได้ ซึ่งการเชื่อต่อสามารถทำได้ทันทีตามความต้องการและด้วยประสิทธิภาพสูง เครื่องมือที่มีให้กับผู้จัดการและนักวิเคราะห์ใช้งานง่าย สามารถออกรายงานได้ด้วยการคลิกปุ่มเดียว
- ข้อมูลในคลังข้อมูลมีความถูกต้องตรงกันหมด คําถามเดียวกันต้องได้รับคำตอบที่เหมือนกันเสมอไม่ว่าผู้ถามจะเป็นใคร ถามเวลาใด
- ข้อมูลในคลังข้อมูลสามารถถูกวิเคราะห์จากหัวข้อในธุรกิจประเภทนั้น โดยแบ่งข้อมูลหรือรวมข้อมูลมาวิเคราะห์ตามความต้องการ
- คลังข้อมูลเป็นส่วนที่ผลิตข้อมูลจาก OLTP ข้อมูลไม่เพียงแต่ถูกรวบรวมมาไว้ที่ศูนย์กลางอย่างเดียว แต่จะถูกรวบรวมอย่างระมัดระวังจากแหล่งข้อมูลหลายๆ แห่งนอกองค์กรด้วย แล้วมาปรับปรุงให้เหมาะสมกับการใช้งานเท่านั้น ถ้าข้อมูลเชื่อถือไม่ได้หรือไม่สมบูรณ์จะไม่ถูกอนุญาตให้นำไปใช้
- คุณภาพของข้อมูลในคลังข้อมูลเป็นตัวผลักดันให้สามารถทําการ Re-engineering ธุรกิจได้