สรุปบทที่ 3 ฐานข้อมูล และคลังข้อมูล

สรุปบทที่ 3
ฐานข้อมูล และคลังข้อมูล

โครงสร้างข้อมูล
โครงสร้างข้อมูลมีรูปแบบเป็นลำดับขั้นโดยเริ่มด้วยหน่วยที่เล็กที่สุดคือ บิต (Bit) ไบต์ (Byte)เขตข้อมูล(Field) ระเบียนข้อมูล(Record) ไฟล์(File ) ตามลำดับ
    บิต (Bit)เป็นหน่วยที่เล็กที่สุดของข้อมูลที่จัดเก็บในระบบคอมพิวเตอร์ ประกอบด้วย เลขฐานสองซึ่งมีสถานะเป็น 0 กับ 1
    ไบต์(Byte) ประกอบด้วยบิตหลายๆ บิตมาเรียงต่อกัน เช่น 8 บิตมาเรียงต่อกันเป็น ไบต์ทำให้สามารถสร้างรหัสแทนข้อมูลเพื่อใช้แทนอักขระ ซึ่งอาจเป็นต้วเอล ตัวอักษร หรือ สัญลักษณ์ได้ทั้งหมด 28 ตัวหรือเท่ากับ 256 ตัว
    เขตข้อมูล(Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำเพื่อให้เกิด ความหมาย เช่น ชื่อพนักงาน และเงินเดือนพนักงาน เป็นต้น
    ระเบียนข้อมูล(Record)กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน ถูกนำมาไว้รวมกัน เช่น ระเบียนข้อมูลของพนักงาน ประกอบด้วยเขตข้อมูล รหัสพนักงาน ซื่อ-สกุล เงินเดือนและแผนก เป็นต้น
    ไฟล์(File )กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันถูกนำมาจัดเก็บไว้ด้วยกัน เช่น ไฟล์ประวัติพนักงาน ประกอบด้วยระเบียนข้อมูลของพนักงานทั้งหมดในองค์การเป็นต้น

ปัญหาเกี่ยวกับแฟ้มข้อมูล
1. ความซ้ำซ้อนของข้อมูล(Data Redundancy)
2. ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence)
3. การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data Sharing)
4. การขาดความคล่องตัว (Lack of Flexvility )
5. การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security)

แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล
1. ลดความซ้ำซ้อนของข้อมูล(Minimum Redundancy)
2. มีความเป็นอิสระของข้อมูล (Data Independence)
3. สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing)
4. มีความคล่องตัวในการใช้งาน(Improved Flexibility)
5. มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity)

ปัญหาเกี่ยวกับแฟ้มข้อมูล
ระบบฐานข้อมูลประกอบด้วยองค์ประกอบหลัก 4 ส่วน คือ ข้อมูล (Data) ฮาร์ดแวร์ (Hardware) ซอฟแวร์ (Software) และผู้ใช้ (Users)
1. ข้อมูล (Data) หมายถึง ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล
 2. ฮาร์ดแวร์ (Hardware)ได้แก่ เครื่องคอมพิวเตอร์และอุปกรณ์รอบข้าง (Peripherals)
3. ซอฟแวร์ (Software)ได้แก่ ระบบปฏิบัติการ (Operating Systems)และระบบจัดการข้อมูล (Database Management Systeme : DBMS) รวมทั้งโปรแกรมยูทิลิตี้ต่าง ๆ
 4. ผู้ใช้ (Users)ได้แก่ บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล เช่น ผู้บริหารฐานข้อมูล (Database Administrator : DBA) นักวิเคราะห์ระบบ (System Analysts) ผู้เขียนโปรแกรมประยุกต์ (Programmers)และผู้ใช้งาน (End Users) เป็นต้น

ระบบจัดการฐานข้อมูล ( Database Management System) หรือที่เรียกว่า ดีบีเอ็มเอส (DBMS)
คือ ซอฟต์แวร์สำหรับบริหารและจัดการฐานข้อมูล เปรียบเสมือนสื่อกลางระหว่างผู้ใช้ และโปรแกรมต่างๆ ที่เกี่ยวข้องกับการใช้ฐานข้อมูล ซึ่งมีหน้าที่ช่วยให้ผู้ใช้เข้าถึงข้อมูลได้ง่าย สะดวกและมีประสิทธิภาพ การเข้าถึงข้อมูลของผู้ใช้ อาจเป็นการสร้างฐานข้อมูล การแก้ไข ฐานข้อมูล หรือการตั้งคำถามเพื่อให้ได้ข้อมูลมาโดยผู้ใช้ไม่จำเป็นต้องรับรู้เกี่ยวกับรายละเอียด ภายในโครงสร้างของฐานข้อมูล เปรียบเสมือนเป็นสื่อกลางระหว่างผู้ใช้และโปรแกรมต่าง ๆ ที่ เกี่ยวข้องกับการใช้ฐานข้อมูลซึ่งต่างจากระบบแฟ้มข้อมูลที่หน้าที่เหล่านี้จะเป็นหน้าที่ของ โปรแกรมเมอร์

รูปแบบของฐานข้อมูล (Database Model)
1. แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical Database Model)
ข้อดีและข้อจำกัดของแบบจำลองฐานข้อมูลลำดับชั้น แบบจำลงฐานข้อมูลลำดับชั้นมีโครงสร้างที่เข้าใจง่าย มี ความซับซ้อนน้อยและเหมาะกับข้อมูลที่มีการเรียงลำดับ อย่างต่อเนื่อง แต่ไม่สามารถรองรับความสัมพันธ์ของข้อมูล ในลักษณะ Many-to-Many และการเข้าถึงข้อมูลจะมีความ คล่องตัวน้อย เพราะจะเริ่มจำ  Root Segment เสมอ
2. แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model)
ข้อดีและข้อจำกัดของแบบจำลองฐานข้อมูลเครือข่าย ความซ้ำซ้อนของข้อมูลมีน้อยกว่าแบบจำลองฐานข้อมูล ลำดับชั้น และสนับสนุนความสัมพันธ์ของข้อมูลในลักษณะ Many-to-Many ซึ่งสามเชื่อมโยงข้อมูลแบบไป-กลับได้ โดย จะใช้พอยน์เตอร์ (Pointer)ในการเชื่อมโยงและเข้าถึงข้อมูล แต่วิธีนี้จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์ และยังมี ความยุ่งยากอยู่ ในการเปลี่ยนแปลงโครงสร้างข้อมูลที่มี ความซับซ้อน อีกทั้งผู้เขียนโปรแกรมจะต้องเข้าใจใน โครงสร้างของข้อมูลเป็นอย่างดี
3. แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational Database Model)
ข้อดีและข้อจำกัดของแบบจำลองฐานข้อมูลเชิงสัมพันธ์  แบบจำลองฐานข้อมูลเชิงสัมพันธ์มีโครงสร้างที่เข้าใจ ง่าย มีระบบจัดการฐานข้อมูลที่ช่วยให้การจัดการกับข้อมูล ทำโดยง่าย ผู้ใช้ไม่จำเป็นต้องรู้ถึงโครงสร้างการจัดเก็บ ข้อมูลทางกายภาพเพราะจะซ่อนความซับซ้อนของระบบไว้ และข้อมูลมีความเป็นอิสระจากโปรแกรม แต่จำเป็นต้องใช้ ฮาร์ดแวร์และซอฟต์แวร์ที่มีความสามารถสูง

ดาต้าไมนิ่ง (Data Mining)
ดาต้าไมนิ่ง เป็นเครื่องมือและเทคนิคในการสกัด (Extract) ข้อมูลและประมวลผลข้อมูลในเชิง วิเคราะห์ขั้นสูงจากฐานข้อมูลขนาดใหญ่ โดยสามารถค้นหารูปแบบ แนวโน้ม พฤติกรรมและความสัมพันธ์ที่ ซ่อนอยู่ภายในข้อมูลเพื่อนให้ได้ความรู้ใหม่หรือคำตอบในลักษณะสิ่งต่อไปนี้
1. ความสัมพันธ์ที่เกี่ยวข้อง (Association)
2. ลำดับของข้อมูล (Sequence) 3. การหากฎเกณฑ์ในการจัดกลุ่ม (Classification)
4. การจัดกลุ่มของความคล้ายคลึง (Cluster)
5. การพยากรณ์(Forecasting)

สรุป

คลังข้อมูล (Data Warehouse) เป็นการรวบรวมข้อมูลจากฐานข้อมูลของระบบงาน ปฏิบัติงานประจำวันขององค์กรแล้วนำมาแปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมในการจัดเก็บ และสะดวกในการใช้งานแล้วจึงนำข้อมูลนั้นเข้าไปเก็บในคลังข้อมูล(Data Warehouse) การ พัฒนาหรือสร้างคลังข้อมูลมาใช้ในองค์กรจะต้องมีการพิจารณาถึงองค์ประกอบที่จำเป็นในการ สร้างให้เหมาะสมด้วยทั้งนี้เพื่อให้เกิดความคุ้มค่าในการลงทุนและเกิดประโยชน์สูงสุดต่อองค์กร

อ้างอิง
file:///C:/Users/2210/Downloads/%E0%B8%9A%E0%B8%97%E0%B8%97%E0%B8%B5%E0%B9%88%203.pdf

ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

สรุปบทที่ 10 เทคโนโลยีกับการจัดการความรู้

สรุปบทที่1 แนวคิดเกี่ยวกับระบบสารสนเทศ