ข้อมูล คือ ข้อเท็จจริงที่มารวบรวมไว้และมีความหมาย อาจเกี่ยวข้องกับคน สิ่งของหรือเหตุการณ์อื่นๆในการประมวลผลของคอมพิวเตอร์ นิยมใช้เป็นส่วนนำเข้าพื้นฐานเพื่อให้ได้สารสนเทศสำหรับการช่วยตัดสินใจเพื่อนำเอาไปใช้ประโยชน์อื่นๆอีกได้ตามต้องการ โดยปกติข้อมูลที่จะนำมาใช้ประมวลผลจะมีอยู่กระจัดกระจายทั่วไป เมื่อต้องการใช้จำเป็น ต้องมีการจัดเรียงใหม่ให้อยู่ในรูปแบบที่สามารถนำเอามาใช้ได้อย่างเป็นระบบ เพื่อให้ข้อมูลนั้นสามารถนำเอาไปใช้ได้ตรงตามความต้องการและมีระเบียบมากยิ่งขึ้น แหล่งข้อมูล ข้อมูลถือได้ว่าเป็นองค์ประกอบหนึ่งที่สำคัญสำหรับการประมวลผลด้วยคอมพิวเตอร์ ในยุคโลกาภิวัตน์ ที่การติดตั้งสื่อสารไม่ได้จำกัดและระยะทางหรือพรมแดนอีกต่อไป ยิ่งทำให้ข้อมูลถูกเผยแพร่และกระจายการใช้การใช้งานมากยิ่งขึ้น ข้อมูลสำหรับการนำมาประมวลผลด้วยคอมพิวเตอร์นั้นจะได้มาจากแหล่ง มีมา 2 ประเภทด้วยกันคือ1. แหล่งข้อมูลภายใน เป็นแหล่งกำเนิดของข้อมูลที่อยู่ในองค์กรทั่วไป ข้อมูลที่ได้มานั้นอาจมาจากพนักงานหรือมีอยู่แล้วในองค์กร เช่น ยอดขายประจำปี ข้อมูลผู้ถือหุ้น รายงานกำไรขาดทุน รายชื่อพนักงาน ข้อมูลเหล่านี้จะให้ข้อมูลที่เกี่ยวข้องกับข้อเท็จจริงต่างๆภายในองค์กรแต่เพียงอย่างเดียว อาจเป็นข้อมูลที่เปิดเผยให้กับบุคคลภายนอกทราบหรือไม่ก็ได้2.แหล่งข้อมูลภายนอก เป็นแหล่งกำเนิดข้อมูลที่อยู่ภายนอกองค์กร โดยทั่วไปแล้วสามารถนำข้อมูลต่าง ๆเหล่านั้นมาใช้ประโยชน์ในองค์กรหรือนำมาใช้กับการประมวลผลด้วยคอมพิวเตอร์ เพื่อให้ได้ระบบงานที่สมบูรณ์ขึ้น ข้อมูลเหล่านี้เช่น ข้อมูลลูกค้า เจ้าหนี้ อัตราดอกเบี้ยสถาบันการเงิน
คุณสมบัติของข้อมูลที่ดี ข้อมูลที่นำมาใช้ประมวลผลเพื่อให้ได้สารสนเทศที่ต้องการนั้น อาจได้มาจากทั้งแหล่งข้อมูลภายในหรือภายนอกองค์กร ซึ่งหากได้ข้อมูลที่ดีย่อมหมายถึงความได้เปรียบในการดำเนินการตามไปด้วย ซึ่งจำเป็นต้องมีคุณสมบัติขั้นพื้นฐาน ดังนี้ความถูกต้อง Accuracy ข้อมูลที่ดีต้องมีความถูกต้องเพื่อให้สามารถนำเอาไปใช้ประโยชน์ได้ ข้อมูลที่ไม่เป็นจริงและมีความคลาดเคลื่อนอยู่มาก อาจก่อให้เกิดความเสียหายต่อการเอาข้อมูลนั้นเอาไปใช้ต่ออีกได้ มีความเป็นปัจจุบันUpdate ข้อมูลที่ดีจำมูลเป็นต้องมีการปรับปรุงแก้ไขให้มีความเป็นปัจจุบันอยู่เสมอเนื่องจากปกติข้อมูลจะมีลักษณะคงที่ เว้นแต่ว่าจะมีผู้ที่มาแก้ไขเปลี่ยนแปลงข้อมูลนั้นเสียใหม่ อีกทั้งเหตุการณ์ต่างๆมักเกิดใหม่อยู่ตลอดเวลา ตรงตามความต้องการ Relevanceควรมีการสำรวจเกี่ยวกับขอบเขตของข้อมูลที่จะมาใช้ให้สอดคล้องและตรงกับความต้องการของหน่วยงานให้มากที่สุด ข้อมูลนั้นถึงแม้จะถูกต้องมากแค่ไหนแต่หากไม่สอดคล้องกับความต้องการก็ไม่สามารถนำไปใช้ประโยชน์หรือช่วยในการตัดสินใจใดๆ ได้ ความสมบูรณ์ Complete การนำเอาข้อมูลมาใช้ประโยชน์นั้นจะต้องมีความสมบูรณ์ของข้อมูลมากพอ จึงจะทำให้การนำเอาไปใช้นั้นเกิดประโยชน์อย่างเต็มที่ การเก็บรวบรวมข้อมูลสามารถทำได้มากกว่าหนึ่งครั้งเพื่อให้ได้ข้อมูลที่สมบูรณ์จริงๆ เช่น การเก็บข้อมูลเชิงสถิติหรือวัดค่าเฉลี่ยอาจต้องเก็บรวบรวมข้อมูลโดยการออกแบบสอบถามรอบแรกเสียก่อนหรือที่เรียกว่า ข้อมูลปฐมภูมิ ความสมบูรณ์ของข้อมูลนี้อาจรวมถึงข้อมูลนั้นต้องมีความครบถ้วนด้วย สามารถตรวจสอบได้ Verifiable
ข้อมูลที่อยู่ในปัจจุบันอาจหามาได้จากแหล่งข้อมูลหลายๆที่ซึ่งอาจมีทั้งข้อมูลที่เชื่อถือได้หรือข้อมูลซึ่งเป็นกลลวงของคู่แข่ง ดังนั้นห่างต้องการนำมาประมวลผลจึงควรเลือกข้อมูลที่สามารถตรวจสอบแหล่งที่มา หรือแหล่งที่มีหลักฐานอ้างอิงต่างๆเสียก่อน เพื่อป้องกันข้อมูลที่ไม่เกิดประโยชน์และอาจนำผลเสียหายมาให้ได้ ข้อมูลที่อยู่ในปัจจุบันอาจหามาได้จากแหล่งข้อมูลหลายๆที่ซึ่งอาจมีทั้งข้อมูลที่เชื่อถือได้หรือข้อมูลซึ่งเป็นกลลวงของคู่แข่ง ดังนั้นห่างต้องการนำมาประมวลผลจึงควรเลือกข้อมูลที่สามารถตรวจสอบแหล่งที่มา หรือแหล่งที่มีหลักฐานอ้างอิงต่างๆเสียก่อน เพื่อป้องกันข้อมูลที่ไม่เกิดประโยชน์และอาจนำผลเสียหายมาให้ได้การแบ่งลำดับชั้นของการจัดการข้อมูล Hierarchy of Data ในการจักการข้อมูลนั้นจะมีการจัดแบ่งข้อมูลออกเป็นลำดับเพื่อง่ายต่อการเรียกใช้และประมวลผล ซึ่งจะขออธิบายเกี่ยวกับลำดับชั้นข้อมูลพื้นฐานในการจักการข้อมูลนั้นจะมีการจัดแบ่งข้อมูลออกเป็นลำดับเพื่อง่ายต่อลำดับชั้นของการจัดการข้อมูล
บิต (Bit = Binary Digit)
เป็นลำดับชั้นของหน่วยข้อมูลที่เล็กที่สุด ดังที่ทราบกันดีแล้วว่าข้อมูลที่จะทำงานร่วมกับคอมพิวเตอร์ได้นั้น จะต้องเอามาแปลงให้อยู่ในรูปของเลขฐานสองเสียก่อนคอมพิวเตอร์จึงจะเข้าใจและทำงานตามที่ต้องการได้ เมื่อแปลงแล้วจะได้ตัวเลขแทนสถานะเปิดและปิด ของสัญญาณไฟฟ้าที่เรียกว่า บิต เพียง 2 ค่าเท่านั้นคือ บิต 0 และบิต 1เป็นลำดับชั้นของหน่วยข้อมูลที่เล็กที่สุด ดังที่ทราบกันดีแล้วว่าข้อมูลที่จะทำงานร่วมกับคอมพิวเตอร์ได้นั้น จะต้องเอามาแปลงให้อยู่ในรูปของเลขฐานสองเสียก่อนคอมพิวเตอร์จึงจะเข้าใจและทำงานตามที่ต้องการได้ เมื่อแปลงแล้วจะได้ตัวเลขแทนสถานะเปิดและปิด ของสัญญาณไฟฟ้าที่เรียกว่า บิต เพียง 2 ค่าเท่านั้นคือ บิต 0 และบิต 1ไบต์ (Byte)เมื่อนำบิตมารวมกันหลายๆบิต จะได้หน่วยข้อมูลกลุ่มใหม่ที่เรียกว่า ไบต์ (Byte) ซึ่งจำนวนของบิตที่ได้นั้นแต่ละกลุ่มอาจมีมากหรือน้อยบ้าง ทั้งนี้ขึ้นอยู่กับชนิดของรหัสที่ใช้เก็บ แต่โดยปกติกับการใช้งานในรหัสแอสกีทั่วไปจะได้กลุ่มของบิต 8 บิตด้วยกัน ซึ่งนิยมมาแทนเป็นรหัสของตัวอักษร บางครั้งจึงนิยมเรียกข้อมูล 1 ไบต์ว่าเป็น 1 ตัวอักษรฟีลด์ หรือเขตของข้อมูล (Field)ประกอบด้วยกลุ่มของตัวอักษรหรือไบต์ตั้งแต่ 1 ตัวขึ้นไปมาประกอบกันเป็นหน่วยข้อมูลที่ใหญ่ขึ้นแล้วแสดงลักษณะหรือความหมายอย่างใดอย่างหนึ่ง ยกตัวอย่างเขตข้อมูลเกี่ยวกับพนักงาน เช่น รหัสพนักงาน ชื่อ นามสกุล เงินเดือน ตำแหน่งเรคคอร์ด (Record) เป็นกลุ่มของเขตข้อมูลหรือฟีลด์ที่มีความสัมพันธ์กัน และนำมาจัดเก็บรวมกันเป็นหน่วยใหม่ที่ใหญ่ขึ้นเพียงหน่วยเดียว ปกติในการจัดการข้อมูลใดมักประกอบด้วยเรคคอร์ด ทั้งนี้ขึ้นอยู่กับขนาดของข้อมูลเป็นหลักไฟล์ หรือแฟ้มตารางข้อมูล (File)ไฟล์ หรือแฟ้มข้อมูล เป็นการนำเอาข้อมูลทั้งหมดหลายๆเรคคอร์ดที่ต้องการจัดเก็บมาเรียงอยู่ในรูแปบของแฟ้มตารางข้อมูลเดียวกัน เช่น แฟ้มตารางข้อมูลเกี่ยวกับคะแนนนักศึกษาวิชาเทคโนโลยีสารสนเทศ อาจประกอบด้วยเรคคอร์ดของนักศึกษาหลายๆคนที่เก็บข้อมูลเกี่ยวกับ รหัสนักศึกษา ชื่อ นามสกุล และคะแนนที่ได้ฐานข้อมูล (Database) เกิดจากการรวบรวมเอาแฟ้มตารางข้อมูลหลายๆแฟ้มที่มีความสัมพันธ์กันมาเก็บรวมกันไว้ที่เดียว โดยจะมีการเก็บคำอธิบายเกี่ยวกับโครงสร้างฐานข้อมูลหรือที่เรียกว่า พจนานุกรมข้อมูล (data dictionary) ซึ่งจะใช้อธิบายลักษณะของข้อมูลที่เก็บไว้ เป็นต้นว่า โครงสร้างของแต่ละตารางเป็นอย่างไร ประกอบด้วยฟีลด์อะไรบ้าง คุณลักษณะของแต่ละฟีลด์และความสัมพันธ์ของแต่ละแฟ้มเป็นอย่างไร ซึ่งข้อมูลเหล่านี้ถือว่ามีความจำเป็นมากและจะถูกเรียกใช้ในระหว่างที่มีการประมวลผลฐานข้อมูลนั่นเอง
พอจะยกตัวอย่างได้ดังนี้
1.ฐานข้อมูลทะเบียนราษฎร์ จัดเก็บข้อมูลเกี่ยวกับประชากรในประเทศไทยทั้งหมด เช่น ข้อมูลการเกิด การตายการย้ายหรือเปลี่ยนแปลงที่อยู่
2.ฐานข้อมูลทะเบียนนักศึกษา ซึ่งจัดเก็บข้อมูลเกี่ยวกับประวัตินักศึกษา เช่น ผลการเรียน ความประพฤติ
3.ฐานข้อมูลบุคลากร ซึ่งจัดเก็บข้อมูลเกี่ยวข้องกับพนักงานทั้งหมดในองค์กร เช่น ประวัติการทำงาน ประวัติการศึกษา คู่สมรส บุตร สุขภาพการเจ็บป่วยเป็นต้น
การจัดโครงสร้างของแฟ้มข้อมูล (File Organization)
. โครงสร้างของแฟ้มข้อมูลแบบเรียงลำดับ (Sequential File Structure) เป็นโครงสร้างของแฟ้มข้อมูลชนิดพื้นฐานที่สามารถใช้งานได้ง่ายที่สุด เนื่องจากมีลักษณะการจัดเก็บข้อมูลแบบเรียงลำดับเรคคอร์ดต่อเนื่องกันไปเรื่อยๆ การอ่านหรือค้นคืนข้อมูลจะข้ามลำดับไปอ่านตรงตำแหน่งใดๆที่ต้องการโดยตรงไม่ได้ เมื่อต้องการอ่านข้อมูลที่เรคคอร์ดใดๆโปรแกรมจะเริ่มอ่านตั้งแต่เรคคอร์ดแรกไปเรื่อยๆจนกว่าจะพบเรคคอร์ดที่ต้องการ ก็จะเรียกค้นคืนเรคคอร์ดนั้นขึ้นมา
การใช้ข้อมูลเรียงลำดับนี่จึงเหมาะสมกับงานประมวลผลที่มีการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆตามลำดับและปริมาณครั้งละมากๆตัวอย่างเช่น ใบแจ้งหนี้ค่าบริการไฟฟ้า น้ำประปา ค่าโทรศัพท์หรือค่าบริการสาธารณูปโภคอื่นๆที่มีเรคคอร์ด
การใช้ข้อมูลเรียงลำดับนี่จึงเหมาะสมกับงานประมวลผลที่มีการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆตามลำดับและปริมาณครั้งละมากๆตัวอย่างเช่น ใบแจ้งหนี้ค่าบริการไฟฟ้า น้ำประปา ค่าโทรศัพท์หรือค่าบริการสาธารณูปโภคอื่นๆที่มีเรคคอร์ดของลูกค้าจำนวนมาก เป็นต้น
แฟ้มข้อมูลแบบนี้ถ้าเป็นเครื่องคอมพิวเตอร์ระดับเมนเฟรมขนาดใหญ่ก็จะจัดเก็บอยู่ในอุปกรณ์ประเภทเทปแม่เหล็ก (magnetic tape) ซึ่งมีการเข้าถึงแบบลำดับ (Sequential access) เวลาอ่านข้อมูลก็ต้องเป็นไปตามลำดับด้วย คล้ายกับการเก็บข้อมูลเพลงลงบนเทปคาสเซ็ต ซึ่งสมมติว่าในม้วนเทปหนึ่งมีการเก็บเพลงได้ 10 เพลง ความยาวเพลงละ 3 นาที ซึ่งหากต้องการค้นหาเพลงใดก็ต้องเริ่มต้นจากเพลงแรกไปเป็นลำดับจนกว่าจะพบ2. โครงสร้างของแฟ้มข้อมูลแบบสุ่ม (Direct/Random File Structure)
แฟ้มข้อมูลแบบนี้ถ้าเป็นเครื่องคอมพิวเตอร์ระดับเมนเฟรมขนาดใหญ่ก็จะจัดเก็บอยู่ในอุปกรณ์ประเภทเทปแม่เหล็ก (magnetic tape) ซึ่งมีการเข้าถึงแบบลำดับ (Sequential access) เวลาอ่านข้อมูลก็ต้องเป็นไปตามลำดับด้วย คล้ายกับการเก็บข้อมูลเพลงลงบนเทปคาสเซ็ต ซึ่งสมมติว่าในม้วนเทปหนึ่งมีการเก็บเพลงได้ 10 เพลง ความยาวเพลงละ 3 นาที ซึ่งหากต้องการค้นหาเพลงใดก็ต้องเริ่มต้นจากเพลงแรกไปเป็นลำดับจนกว่าจะพบ2. โครงสร้างของแฟ้มข้อมูลแบบสุ่ม (Direct/Random File Structure)
¢เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่เข้าถึงได้โดยตรง เมื่อต้องการอ่านค่าเรคคอร์ดใดๆสามารถทำการเลือกหรืออ่านค่านั้นได้ทันที ไม่จำเป็นต้องผ่านเรคคอร์ดแรกๆเหมือนกับแฟ้มข้อมูลแบบเรียงลำดับ ซึ่งทำให้การเข้าถึงข้อมูลได้รวดเร็วกว่า ปกติจะมีการจัดเก็บในสื่อที่มีลักษณะการเข้าถึงได้โดยตรงประเภทจานแม่เหล็ก เช่น ดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM เป็นต้น
3. โครงสร้างของแฟ้มข้อมูลแบบลำดับเชิงดรรชนี (Index Sequential File Structure)
เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่อาศัยกระบวนการที่เรียกว่า ISAM (Index Sequential Access Method ) ซึ่งรวมเอาความสามารถในการเข้าถึงข้อมูลแบบสุ่มและแบบเรียงตามลำดับเข้าไว้ด้วยกัน การจัดโครงสร้างแฟ้มข้อมูลวิธีนี้ ข้อมูลจะถูกจัดเก็บเรียงกันตามลำดับไว้บนสื่อแบบสุ่ม เช่น ฮาร์ดดิสก์ และการเข้าถึงข้อมูลจะทำผ่านแฟ้มข้อมูลลำดับเชิงดรรชนี (Index Sequential File) ซึ่งทำหน้าที่ช่วยชี้และค้นหาข้อมูลที่ต้องการได้ สามารถทำงานได้ยืดหยุ่นกว่าวิธีอื่นๆโดยเฉพาะกับกรณีที่ข้อมูลในการประมวลผลมีจำนวนมากๆ
โครงสร้างแฟ้มข้อมูลแบบนี้จะมีหลักการทำงานคล้ายกับรูปแบบดรรชนีท้ายเล่มหนังสือที่มีการจัดเรียงหัวเรื่องแยกไว้เป็นลำดับตามหมวดหมู่อักษรตั้งแต่ A-Zหรือ ก-ฮ เมื่อสนใจหัวเรื่องใดโดยเฉพาะ ผู้อ่านสามารถไล่ค้นได้จากชื่อหัวเรื่องที่พิมพ์เรียงกันไว้เป็นลำดับนั้นเพื่อดูหมายเลขหน้าได้ ซึ่งทำให้ง่ายและสะดวกมากยิ่งขึ้น
โครงสร้างแฟ้มข้อมูลแบบนี้จะมีหลักการทำงานคล้ายกับรูปแบบดรรชนีท้ายเล่มหนังสือที่มีการจัดเรียงหัวเรื่องแยกไว้เป็นลำดับตามหมวดหมู่อักษรตั้งแต่ A-Zหรือ ก-ฮ เมื่อสนใจหัวเรื่องใดโดยเฉพาะ ผู้อ่านสามารถไล่ค้นได้จากชื่อหัวเรื่องที่พิมพ์เรียงกันไว้เป็นลำดับนั้นเพื่อดูหมายเลขหน้าได้ ซึ่งทำให้ง่ายและสะดวกมากยิ่งขึ้น
เปรียบเทียบโครงสร้างแฟ้มข้อมูลแต่ละประเภท การจัดการเกี่ยวกับโครงสร้างของแฟ้มข้อมูล ควรคำนึงถึงความสามารถด้านเวลาในการเข้าถึงข้อมูล ของอุปกรณ์ที่ใช้จัดเก็บด้วย การจัดการเกี่ยวกับโครงสร้างของแฟ้มข้อมูลอาจเปรียบเทียบได้กับการเลือกค้นหรืออ่านเนื้อหาข้อมูลในหนังสือที่ย่อมขึ้นอยู่กับความต้องการและความสะดวกของผู้ใช้เป็นหลักความแตกต่างของการจัดการเกี่ยวกับโครงสร้างของแฟ้มข้อมูลทั้ง 3 ประเภท จะเปรียบเทียบคุณสมบัติต่างๆ ดังต่อไปนี้
การเปรียบเทียบโครงสร้างของแฟ้มข้อมูล
1 . โครงสร้างแฟ้ม แบบเรียงลำดับ
ข้อดี - เสียค่าใช้จ่ายน้อยและใช้งานได้ง่ายกว่าวิธีอื่นๆ
- เหมาะกับงานประมวลผลที่มีการอ่านข้อมูลแบบเรียงลำดับและในปริมาณมาก
- สื่อที่ใช้เก็บเป็นเทปซึ่งมีราคาถู
ข้อเสีย - การทำงานเพื่อค้นหาข้อมูลจะต้องเริ่มทำตั้งแต่ต้นไฟล์เรียงลำดับไปเรื่อย จนกว่าจะหาข้อมูลนั้นเจอ ทำให้เสียเวลาค่อนข้างมาก
- ข้อมูลที่ใช้ต้องมีการจัดเรียงลำดับก่อนเสมอ
สื่อที่ใช้เก็บ เทปแม่เหล็ก เช่น เทปคาสเซ็ต
- ข้อมูลที่ใช้ต้องมีการจัดเรียงลำดับก่อนเสมอ
สื่อที่ใช้เก็บ เทปแม่เหล็ก เช่น เทปคาสเซ็ต
2.โครงสร้างแฟ้ม แบบสุ่ม
ข้อดี สามารถทำงานได้เร็ว เพราะมีการเข้าถึงข้อมูลเรคคอร์ดแบบเร็วมาก เพราะไม่ต้องเรียงลำดับข้อมูลก่อนเก็บลงไฟล์
- เหมาะสมกับการใช้งานธุรกรรมออนไลน์ หรืองานที่ต้องการแก้ไข เพิ่ม ลบรากการเป็นประจำ
- เหมาะสมกับการใช้งานธุรกรรมออนไลน์ หรืองานที่ต้องการแก้ไข เพิ่ม ลบรากการเป็นประจำ
ข้อเสีย ไม่เหมาะกับงานประมวลผลที่อ่านข้อมูลในปริมาณมาก
- การเขียนโปรแกรมเพื่อค้นหาข้อมูลจะซับซ้อน
- ไม่สามารถเข้าถึงข้อมูลแบบเรียงลำดับได้
สื่อที่ใช้เก็บ จานแม่เหล็กเช่น ดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM
3.โครงสร้างแฟ้มแบบ ลำดับเชิงดรรชนี
ข้อดี - สามารถรองรับการประมวลผลได้ทั้ง 2 แบบคือ แบบลำดับและแบบสุ่ม
- เหมาะกับงานธุรกรรมออนไลน์ ด้วยเช่นเดียวกัน
- เหมาะกับงานธุรกรรมออนไลน์ ด้วยเช่นเดียวกัน
ข้อเสีย - สิ้นเปลืองเนื้อที่ในการจัดเก็บดรรชนีที่ใช้อ้างอิงถึงตำแหน่งของข้อมูล
- การเขียนโปรแกรมเพื่อค้นหาข้อมูลจะซับซ้อน
- การทำงานช้ากว่าแบบสุ่ม และมีค่าใช้จ่ายสูง
สื่อที่ใช้เก็บจานแม่เหล็ก เช่น ดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM
ประเภทของแฟ้มข้อมูล File type
นอกจากจะแบ่งแฟ้มข้อมูลที่มีตามรูปแบบหรือโครงสร้างการจัดเก็บดังในหัวข้อนี้แล้ว เรายังอาจแบ่งประเภท ของแฟ้มข้อมูลตามลักษณะเนื้อหาของข้อมูลที่เก็บเป็น 2 ประเภท คือ
1. แฟ้มหลัก Master file แฟ้มหลัก เป็นแฟ้มข้อมูลที่มีความถี่ของการเปลี่ยนแปลงข้อมูลไม่บ่อยมากนัก แฟ้มหลักลูกค้าธนาคารซึ่งจะเก็บข้อมูลของลูกค้า เช่น ชื่อ ที่อยู่ หมายเลขบัญชี
2. แฟ้มรายการเปลี่ยนแปลง Transaction file แฟ้มรายการเปลี่ยนแปลง เป็นแฟ้มข้อมูลที่มีการเปลี่ยนหรือแก้ไขของรายการข้อมูลภายในค่อนข้างบ่อย และทำบัตรประจำตัวต่อเนื่องหรือเกิดขึ้นทุกวัน
ระบบฐานข้อมูล
จากปัญหาของการประมวลผลแฟ้มข้อมูลข้างต้น แนวคิดของการแก้ปัยหาดังกล่าวจะใช้วิธีการจัดเก็บรวบรวมแฟ้มข้อมูลที่มีความสัมพันธ์กันนำมาจัดเรียงรวมกันเสียใหม่อย่างเป็นระบบเพื่อให้สะดวกต่อการค้นหาและเรียกใช้ข้อมูลร่วมกัน โดยจัดทำเป็น ระบบฐานข้อมูล นั่นเอง

ระบบฐานข้อมูลสามารถใช้งานได้ทั้งกับเครื่องคอมพิวเตอร์เครื่องเดียว (Standalone)
เช่น ระบบฐานข้อมูลสินค้าคงคลังสำหรับองค์กรขนาดเล็กที่ต้องการจัดเก็บฐานข้อมูลสินค้าไว้เฉพาะในคอมพิวเตอร์เครื่องที่พนักงานบัญชีใช้เพียงเครื่องเดียว หรือจะประยุกต์ใช้กับเครื่องคอมพิวเตอร์แบบแม่ข่าย (Server) ผ่านระบบ LANหรืออินเตอร์เน็ตก็ได้ ทั้งนี้ขึ้นอยู่กับลักษณะของงานที่ต้องการเป็นหลัก ตัวอย่างของการใช้งานระบบฐานข้อมูลกับเครื่องคอมพิวเตอร์แม่ข่าย เช่น การประยุกต์ใช้ฐานข้อมูลบนเว็บ (web database) สำหรับการเก็บข้อมูลสินค้า ข้อมูลการสั่งซื้อ ข้อมูลยอดขาย ข้อมูลเกี่ยวกับการเรียน หรือข้อมูลอื่นๆที่ยินยอมให้ผู้ใช้เรียกดูข้อมูลเหล่านี้ได้ โดยผ่านเครือข่ายอินเทอร์เน็ตซึ่งใช้กันอย่างแพร่หลายในปัจจุบัน
การนำเอาระบบฐานข้อมูลมาใช้งานนั้นจะช่วยให้การทำงานมีความสะดวกมากยิ่งขึ้น หากต่างคนต่างเก็บข้อมูลเอง ไม่ได้นำมาเก็บรวมกันเป็นฐานข้อมูลกลาง อาจส่งผลให้เกิดปัญหาต่างๆตามมาอีกได้ เช่น ความซ้ำซ้อนของการจัดเก็บข้อมูล หรือปัญหาของข้อมูลที่ไม่ตรงกัน
การนำเอาระบบฐานข้อมูลมาใช้งานนั้นจะช่วยให้การทำงานมีความสะดวกมากยิ่งขึ้น หากต่างคนต่างเก็บข้อมูลเอง ไม่ได้นำมาเก็บรวมกันเป็นฐานข้อมูลกลาง อาจส่งผลให้เกิดปัญหาต่างๆตามมาอีกได้ เช่น ความซ้ำซ้อนของการจัดเก็บข้อมูล หรือปัญหาของข้อมูลที่ไม่ตรงกัน
การนำระบบฐานข้อมูลมาใช้จัดการกับข้อมูลนั้นมีแนวคิดที่ตั้งอยู่บนพื้นฐานดังนี้
- ลดความซ้ำซ้อนกันของข้อมูล (Reduced data redundancy)
- ลดความขัดแย้งของข้อมูล (
- ลดความขัดแย้งของข้อมูล (Reduced data inconsistency)
- การรักษาความคงสภาพของข้อมูล (
- การรักษาความคงสภาพของข้อมูล (Improved data integrity)
- ใช้ข้อมูลร่วมกันได้ (
- ใช้ข้อมูลร่วมกันได้ (Shared data)
- ง่ายต่อการเข้าถึงข้อมูล (
- ง่ายต่อการเข้าถึงข้อมูล (Easier access)
- ลดระยะเวลาการพัฒนาระบบงาน (
- ลดระยะเวลาการพัฒนาระบบงาน (Reduced development time)
นอกจากนี้ฐานข้อมูลยังช่วยในเรื่องการรักษาความปลอดภัยของข้อมูล โดยผู้ดูแลระบบจะสามารถกำหนดสิทธิ์ได้ว่าให้ใครหรือผู้ใช้คนใดทำอะไรได้หรือไม่ได้บ้าง เมื่อนำไปใช้ร่วมกับการพัฒนาระบบงานโปรแกรมฐานข้อมูล (Database application) ก็จะทำให้ระบบงานมีประสิทธิภาพมากขึ้นตามไปด้วย โดยผู้ใช้โปรแกรมในแต่ละระดับก็สามารถใช้งานได้แตกต่างกัน
นอกจากนี้ฐานข้อมูลยังช่วยในเรื่องการรักษาความปลอดภัยของข้อมูล โดยผู้ดูแลระบบจะสามารถกำหนดสิทธิ์ได้ว่าให้ใครหรือผู้ใช้คนใดทำอะไรได้หรือไม่ได้บ้าง เมื่อนำไปใช้ร่วมกับการพัฒนาระบบงานโปรแกรมฐานข้อมูล (Database application) ก็จะทำให้ระบบงานมีประสิทธิภาพมากขึ้นตามไปด้วย โดยผู้ใช้โปรแกรมในแต่ละระดับก็สามารถใช้งานได้แตกต่างกัน
เครื่องมือสำหรับจัดการฐานข้อมูล (DBMS)
โดยปกติในการจัดการฐานข้อมูลด้วยคอมพิวเตอร์นั้นจะมีโปรแกรมที่เรียกว่า ระบบการจัดการฐานข้อมูลหรือ DBMS (Database Management Systems) ซึ่งเปรียบเสมือนเป็นผู้จัดการฐานข้อมูลนั่นเอง โปรแกรมประเภทนี้มีการผลิตออกมาหลายระบบด้วยกัน แต่ที่ได้รับความนิยมและเป็นที่รู้จักกันดีคือ ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์หรือ RDBMS (Relational Database
ลักษณะของ DBMS
DBMS เป็นเหมือนตัวกลางที่ยอมให้ผู้ใช้เข้าค้นคืนข้อมูลได้โดยมีเครื่องมือสำคัยคือ ภาษาที่ใช้จัดการกับข้อมูลโดยเฉพาะเรียกว่า ภาษาเรียกค้นข้อมูล หรือ ภาษาคิวรี่ (query language) ซึ่งประกอบด้วยคำสั่งสำหรับเรียกใช้ข้อมูล แก้ไขเปลี่ยนแปลงหรือลบข้อมูล และยังสามารถนำไปใช้ร่วมกับการพัฒนาโปรแกรมประยุกต์ทางด้านฐานข้อมูล (Database application) ได้เป็นอย่างดี
ภาษาคิวรี่ (Query language) เป็นภาษาที่ใช้สำหรับสอบถามหรือจัดการฐานข้อมูลใน DBMS โดยภาษาประเภทนี้ที่ได้รับความนิยมสูงสุดคือ ภาษาSQL (Structure Query language ) คิดค้นโดยนักวิทยาศาสตร์ของไอบีเอ็มในทศวรรษที่ 1970 มีรูปแบบคำสั่งที่คล้ายกับประโยคในภาษาอังกฤษมาก ซึ่งปัจจุบันองค์กร ANSI (American National Standard Institute) ได้ประกาศให้ SQL เป็นภาษามาตรฐานสำหรับสำหรับระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ (Relational Database Management System หรือ RDBMS) ซึ่งเป็นระบบ DBMSแบบที่ใช้กันแพร่หลายที่สุดในปัจจุบัน
ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ ทุกระบบจะใช้คำสั่งพื้นฐานของภาษาSQL ได้เหมือนกันแต่อาจมีคำสั่งพิเศษที่แตกต่างกันบ้าง เนื่องจากบริษัทผู้ผลิตแต่ละรายก็พยายามทีจะพัฒนา RDBMS ของตนเองให้มีลักษณะที่เด่นกว่าระบบอื่นโดยเพิ่มคุณสมบัติที่เกินข้อจำกัดของ ANSI ซึ่งคิดว่าเป็นประโยชน์ต่อผู้ใช้เข้าไป ตัวอย่างของคำสั่ง SQL มีดังนี้
ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ ทุกระบบจะใช้คำสั่งพื้นฐานของภาษาSQL ได้เหมือนกันแต่อาจมีคำสั่งพิเศษที่แตกต่างกันบ้าง เนื่องจากบริษัทผู้ผลิตแต่ละรายก็พยายามทีจะพัฒนา RDBMS ของตนเองให้มีลักษณะที่เด่นกว่าระบบอื่นโดยเพิ่มคุณสมบัติที่เกินข้อจำกัดของ ANSI ซึ่งคิดว่าเป็นประโยชน์ต่อผู้ใช้เข้าไป ตัวอย่างของคำสั่ง SQL มีดังนี้
DELETE ใช้สำหรับลบข้อมูลหรือลบเรคคอร์ดใดๆในฐานข้อมูล
INSERT ใช้สำหรับเพิ่มข้อมูลหรือเพิ่มเรคคอร์ดใดๆในฐานข้อมูล
SELECT ใช้สำหรับเลือกข้อมูลหรือเลือกเรคคอร์ดใดๆที่ต้องการจากฐานข้อมูล
UPDATE ใช้สำหรับแก้ไขข้อมูลหรือแก้ไขเรคคอร์ดใดๆในฐานข้อมูล
แผนผังความสามารถโดยทั่วไปของระบบการจัดการฐานข้อมูล

ข้อมูลที่อยู่ในปัจจุบันอาจหามาได้จากแหล่งข้อมูลหลายๆที่ซึ่งอาจมีทั้งข้อมูลที่เชื่อถือได้หรือข้อมูลซึ่งเป็นกลลวงของคู่แข่ง ดังนั้นห่างต้องการนำมาประมวลผลจึงควรเลือกข้อมูลที่สามารถตรวจสอบแหล่งที่มา หรือแหล่งที่มีหลักฐานอ้างอิงต่างๆเสียก่อน เพื่อป้องกันข้อมูลที่ไม่เกิดประโยชน์และอาจนำผลเสียหายมาให้ได้ ข้อมูลที่อยู่ในปัจจุบันอาจหามาได้จากแหล่งข้อมูลหลายๆที่ซึ่งอาจมีทั้งข้อมูลที่เชื่อถือได้หรือข้อมูลซึ่งเป็นกลลวงของคู่แข่ง ดังนั้นห่างต้องการนำมาประมวลผลจึงควรเลือกข้อมูลที่สามารถตรวจสอบแหล่งที่มา หรือแหล่งที่มีหลักฐานอ้างอิงต่างๆเสียก่อน เพื่อป้องกันข้อมูลที่ไม่เกิดประโยชน์และอาจนำผลเสียหายมาให้ได้การแบ่งลำดับชั้นของการจัดการข้อมูล Hierarchy of Data ในการจักการข้อมูลนั้นจะมีการจัดแบ่งข้อมูลออกเป็นลำดับเพื่อง่ายต่อการเรียกใช้และประมวลผล ซึ่งจะขออธิบายเกี่ยวกับลำดับชั้นข้อมูลพื้นฐานในการจักการข้อมูลนั้นจะมีการจัดแบ่งข้อมูลออกเป็นลำดับเพื่อง่ายต่อลำดับชั้นของการจัดการข้อมูล

เป็นลำดับชั้นของหน่วยข้อมูลที่เล็กที่สุด ดังที่ทราบกันดีแล้วว่าข้อมูลที่จะทำงานร่วมกับคอมพิวเตอร์ได้นั้น จะต้องเอามาแปลงให้อยู่ในรูปของเลขฐานสองเสียก่อนคอมพิวเตอร์จึงจะเข้าใจและทำงานตามที่ต้องการได้ เมื่อแปลงแล้วจะได้ตัวเลขแทนสถานะเปิดและปิด ของสัญญาณไฟฟ้าที่เรียกว่า บิต เพียง 2 ค่าเท่านั้นคือ บิต 0 และบิต 1เป็นลำดับชั้นของหน่วยข้อมูลที่เล็กที่สุด ดังที่ทราบกันดีแล้วว่าข้อมูลที่จะทำงานร่วมกับคอมพิวเตอร์ได้นั้น จะต้องเอามาแปลงให้อยู่ในรูปของเลขฐานสองเสียก่อนคอมพิวเตอร์จึงจะเข้าใจและทำงานตามที่ต้องการได้ เมื่อแปลงแล้วจะได้ตัวเลขแทนสถานะเปิดและปิด ของสัญญาณไฟฟ้าที่เรียกว่า บิต เพียง 2 ค่าเท่านั้นคือ บิต 0 และบิต 1ไบต์ (Byte)เมื่อนำบิตมารวมกันหลายๆบิต จะได้หน่วยข้อมูลกลุ่มใหม่ที่เรียกว่า ไบต์ (Byte) ซึ่งจำนวนของบิตที่ได้นั้นแต่ละกลุ่มอาจมีมากหรือน้อยบ้าง ทั้งนี้ขึ้นอยู่กับชนิดของรหัสที่ใช้เก็บ แต่โดยปกติกับการใช้งานในรหัสแอสกีทั่วไปจะได้กลุ่มของบิต 8 บิตด้วยกัน ซึ่งนิยมมาแทนเป็นรหัสของตัวอักษร บางครั้งจึงนิยมเรียกข้อมูล 1 ไบต์ว่าเป็น 1 ตัวอักษรฟีลด์ หรือเขตของข้อมูล (Field)ประกอบด้วยกลุ่มของตัวอักษรหรือไบต์ตั้งแต่ 1 ตัวขึ้นไปมาประกอบกันเป็นหน่วยข้อมูลที่ใหญ่ขึ้นแล้วแสดงลักษณะหรือความหมายอย่างใดอย่างหนึ่ง ยกตัวอย่างเขตข้อมูลเกี่ยวกับพนักงาน เช่น รหัสพนักงาน ชื่อ นามสกุล เงินเดือน ตำแหน่งเรคคอร์ด (Record) เป็นกลุ่มของเขตข้อมูลหรือฟีลด์ที่มีความสัมพันธ์กัน และนำมาจัดเก็บรวมกันเป็นหน่วยใหม่ที่ใหญ่ขึ้นเพียงหน่วยเดียว ปกติในการจัดการข้อมูลใดมักประกอบด้วยเรคคอร์ด ทั้งนี้ขึ้นอยู่กับขนาดของข้อมูลเป็นหลักไฟล์ หรือแฟ้มตารางข้อมูล (File)ไฟล์ หรือแฟ้มข้อมูล เป็นการนำเอาข้อมูลทั้งหมดหลายๆเรคคอร์ดที่ต้องการจัดเก็บมาเรียงอยู่ในรูแปบของแฟ้มตารางข้อมูลเดียวกัน เช่น แฟ้มตารางข้อมูลเกี่ยวกับคะแนนนักศึกษาวิชาเทคโนโลยีสารสนเทศ อาจประกอบด้วยเรคคอร์ดของนักศึกษาหลายๆคนที่เก็บข้อมูลเกี่ยวกับ รหัสนักศึกษา ชื่อ นามสกุล และคะแนนที่ได้ฐานข้อมูล (Database) เกิดจากการรวบรวมเอาแฟ้มตารางข้อมูลหลายๆแฟ้มที่มีความสัมพันธ์กันมาเก็บรวมกันไว้ที่เดียว โดยจะมีการเก็บคำอธิบายเกี่ยวกับโครงสร้างฐานข้อมูลหรือที่เรียกว่า พจนานุกรมข้อมูล (data dictionary) ซึ่งจะใช้อธิบายลักษณะของข้อมูลที่เก็บไว้ เป็นต้นว่า โครงสร้างของแต่ละตารางเป็นอย่างไร ประกอบด้วยฟีลด์อะไรบ้าง คุณลักษณะของแต่ละฟีลด์และความสัมพันธ์ของแต่ละแฟ้มเป็นอย่างไร ซึ่งข้อมูลเหล่านี้ถือว่ามีความจำเป็นมากและจะถูกเรียกใช้ในระหว่างที่มีการประมวลผลฐานข้อมูลนั่นเอง

พอจะยกตัวอย่างได้ดังนี้
1.ฐานข้อมูลทะเบียนราษฎร์ จัดเก็บข้อมูลเกี่ยวกับประชากรในประเทศไทยทั้งหมด เช่น ข้อมูลการเกิด การตายการย้ายหรือเปลี่ยนแปลงที่อยู่
2.ฐานข้อมูลทะเบียนนักศึกษา ซึ่งจัดเก็บข้อมูลเกี่ยวกับประวัตินักศึกษา เช่น ผลการเรียน ความประพฤติ
3.ฐานข้อมูลบุคลากร ซึ่งจัดเก็บข้อมูลเกี่ยวข้องกับพนักงานทั้งหมดในองค์กร เช่น ประวัติการทำงาน ประวัติการศึกษา คู่สมรส บุตร สุขภาพการเจ็บป่วยเป็นต้น
การจัดโครงสร้างของแฟ้มข้อมูล (File Organization)
. โครงสร้างของแฟ้มข้อมูลแบบเรียงลำดับ (Sequential File Structure) เป็นโครงสร้างของแฟ้มข้อมูลชนิดพื้นฐานที่สามารถใช้งานได้ง่ายที่สุด เนื่องจากมีลักษณะการจัดเก็บข้อมูลแบบเรียงลำดับเรคคอร์ดต่อเนื่องกันไปเรื่อยๆ การอ่านหรือค้นคืนข้อมูลจะข้ามลำดับไปอ่านตรงตำแหน่งใดๆที่ต้องการโดยตรงไม่ได้ เมื่อต้องการอ่านข้อมูลที่เรคคอร์ดใดๆโปรแกรมจะเริ่มอ่านตั้งแต่เรคคอร์ดแรกไปเรื่อยๆจนกว่าจะพบเรคคอร์ดที่ต้องการ ก็จะเรียกค้นคืนเรคคอร์ดนั้นขึ้นมา
การใช้ข้อมูลเรียงลำดับนี่จึงเหมาะสมกับงานประมวลผลที่มีการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆตามลำดับและปริมาณครั้งละมากๆตัวอย่างเช่น ใบแจ้งหนี้ค่าบริการไฟฟ้า น้ำประปา ค่าโทรศัพท์หรือค่าบริการสาธารณูปโภคอื่นๆที่มีเรคคอร์ด
การใช้ข้อมูลเรียงลำดับนี่จึงเหมาะสมกับงานประมวลผลที่มีการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆตามลำดับและปริมาณครั้งละมากๆตัวอย่างเช่น ใบแจ้งหนี้ค่าบริการไฟฟ้า น้ำประปา ค่าโทรศัพท์หรือค่าบริการสาธารณูปโภคอื่นๆที่มีเรคคอร์ดของลูกค้าจำนวนมาก เป็นต้น
แฟ้มข้อมูลแบบนี้ถ้าเป็นเครื่องคอมพิวเตอร์ระดับเมนเฟรมขนาดใหญ่ก็จะจัดเก็บอยู่ในอุปกรณ์ประเภทเทปแม่เหล็ก (magnetic tape) ซึ่งมีการเข้าถึงแบบลำดับ (Sequential access) เวลาอ่านข้อมูลก็ต้องเป็นไปตามลำดับด้วย คล้ายกับการเก็บข้อมูลเพลงลงบนเทปคาสเซ็ต ซึ่งสมมติว่าในม้วนเทปหนึ่งมีการเก็บเพลงได้ 10 เพลง ความยาวเพลงละ 3 นาที ซึ่งหากต้องการค้นหาเพลงใดก็ต้องเริ่มต้นจากเพลงแรกไปเป็นลำดับจนกว่าจะพบ2. โครงสร้างของแฟ้มข้อมูลแบบสุ่ม (Direct/Random File Structure)
แฟ้มข้อมูลแบบนี้ถ้าเป็นเครื่องคอมพิวเตอร์ระดับเมนเฟรมขนาดใหญ่ก็จะจัดเก็บอยู่ในอุปกรณ์ประเภทเทปแม่เหล็ก (magnetic tape) ซึ่งมีการเข้าถึงแบบลำดับ (Sequential access) เวลาอ่านข้อมูลก็ต้องเป็นไปตามลำดับด้วย คล้ายกับการเก็บข้อมูลเพลงลงบนเทปคาสเซ็ต ซึ่งสมมติว่าในม้วนเทปหนึ่งมีการเก็บเพลงได้ 10 เพลง ความยาวเพลงละ 3 นาที ซึ่งหากต้องการค้นหาเพลงใดก็ต้องเริ่มต้นจากเพลงแรกไปเป็นลำดับจนกว่าจะพบ2. โครงสร้างของแฟ้มข้อมูลแบบสุ่ม (Direct/Random File Structure)
¢เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่เข้าถึงได้โดยตรง เมื่อต้องการอ่านค่าเรคคอร์ดใดๆสามารถทำการเลือกหรืออ่านค่านั้นได้ทันที ไม่จำเป็นต้องผ่านเรคคอร์ดแรกๆเหมือนกับแฟ้มข้อมูลแบบเรียงลำดับ ซึ่งทำให้การเข้าถึงข้อมูลได้รวดเร็วกว่า ปกติจะมีการจัดเก็บในสื่อที่มีลักษณะการเข้าถึงได้โดยตรงประเภทจานแม่เหล็ก เช่น ดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM เป็นต้น
3. โครงสร้างของแฟ้มข้อมูลแบบลำดับเชิงดรรชนี (Index Sequential File Structure)
เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่อาศัยกระบวนการที่เรียกว่า ISAM (Index Sequential Access Method ) ซึ่งรวมเอาความสามารถในการเข้าถึงข้อมูลแบบสุ่มและแบบเรียงตามลำดับเข้าไว้ด้วยกัน การจัดโครงสร้างแฟ้มข้อมูลวิธีนี้ ข้อมูลจะถูกจัดเก็บเรียงกันตามลำดับไว้บนสื่อแบบสุ่ม เช่น ฮาร์ดดิสก์ และการเข้าถึงข้อมูลจะทำผ่านแฟ้มข้อมูลลำดับเชิงดรรชนี (Index Sequential File) ซึ่งทำหน้าที่ช่วยชี้และค้นหาข้อมูลที่ต้องการได้ สามารถทำงานได้ยืดหยุ่นกว่าวิธีอื่นๆโดยเฉพาะกับกรณีที่ข้อมูลในการประมวลผลมีจำนวนมากๆ
โครงสร้างแฟ้มข้อมูลแบบนี้จะมีหลักการทำงานคล้ายกับรูปแบบดรรชนีท้ายเล่มหนังสือที่มีการจัดเรียงหัวเรื่องแยกไว้เป็นลำดับตามหมวดหมู่อักษรตั้งแต่ A-Zหรือ ก-ฮ เมื่อสนใจหัวเรื่องใดโดยเฉพาะ ผู้อ่านสามารถไล่ค้นได้จากชื่อหัวเรื่องที่พิมพ์เรียงกันไว้เป็นลำดับนั้นเพื่อดูหมายเลขหน้าได้ ซึ่งทำให้ง่ายและสะดวกมากยิ่งขึ้น
โครงสร้างแฟ้มข้อมูลแบบนี้จะมีหลักการทำงานคล้ายกับรูปแบบดรรชนีท้ายเล่มหนังสือที่มีการจัดเรียงหัวเรื่องแยกไว้เป็นลำดับตามหมวดหมู่อักษรตั้งแต่ A-Zหรือ ก-ฮ เมื่อสนใจหัวเรื่องใดโดยเฉพาะ ผู้อ่านสามารถไล่ค้นได้จากชื่อหัวเรื่องที่พิมพ์เรียงกันไว้เป็นลำดับนั้นเพื่อดูหมายเลขหน้าได้ ซึ่งทำให้ง่ายและสะดวกมากยิ่งขึ้น
เปรียบเทียบโครงสร้างแฟ้มข้อมูลแต่ละประเภท การจัดการเกี่ยวกับโครงสร้างของแฟ้มข้อมูล ควรคำนึงถึงความสามารถด้านเวลาในการเข้าถึงข้อมูล ของอุปกรณ์ที่ใช้จัดเก็บด้วย การจัดการเกี่ยวกับโครงสร้างของแฟ้มข้อมูลอาจเปรียบเทียบได้กับการเลือกค้นหรืออ่านเนื้อหาข้อมูลในหนังสือที่ย่อมขึ้นอยู่กับความต้องการและความสะดวกของผู้ใช้เป็นหลักความแตกต่างของการจัดการเกี่ยวกับโครงสร้างของแฟ้มข้อมูลทั้ง 3 ประเภท จะเปรียบเทียบคุณสมบัติต่างๆ ดังต่อไปนี้
การเปรียบเทียบโครงสร้างของแฟ้มข้อมูล
1 . โครงสร้างแฟ้ม แบบเรียงลำดับ
ข้อดี - เสียค่าใช้จ่ายน้อยและใช้งานได้ง่ายกว่าวิธีอื่นๆ
- เหมาะกับงานประมวลผลที่มีการอ่านข้อมูลแบบเรียงลำดับและในปริมาณมาก
- สื่อที่ใช้เก็บเป็นเทปซึ่งมีราคาถู
ข้อเสีย - การทำงานเพื่อค้นหาข้อมูลจะต้องเริ่มทำตั้งแต่ต้นไฟล์เรียงลำดับไปเรื่อย จนกว่าจะหาข้อมูลนั้นเจอ ทำให้เสียเวลาค่อนข้างมาก
- ข้อมูลที่ใช้ต้องมีการจัดเรียงลำดับก่อนเสมอ
สื่อที่ใช้เก็บ เทปแม่เหล็ก เช่น เทปคาสเซ็ต
- ข้อมูลที่ใช้ต้องมีการจัดเรียงลำดับก่อนเสมอ
สื่อที่ใช้เก็บ เทปแม่เหล็ก เช่น เทปคาสเซ็ต
2.โครงสร้างแฟ้ม แบบสุ่ม
ข้อดี สามารถทำงานได้เร็ว เพราะมีการเข้าถึงข้อมูลเรคคอร์ดแบบเร็วมาก เพราะไม่ต้องเรียงลำดับข้อมูลก่อนเก็บลงไฟล์
- เหมาะสมกับการใช้งานธุรกรรมออนไลน์ หรืองานที่ต้องการแก้ไข เพิ่ม ลบรากการเป็นประจำ
- เหมาะสมกับการใช้งานธุรกรรมออนไลน์ หรืองานที่ต้องการแก้ไข เพิ่ม ลบรากการเป็นประจำ
ข้อเสีย ไม่เหมาะกับงานประมวลผลที่อ่านข้อมูลในปริมาณมาก
- การเขียนโปรแกรมเพื่อค้นหาข้อมูลจะซับซ้อน
- ไม่สามารถเข้าถึงข้อมูลแบบเรียงลำดับได้
สื่อที่ใช้เก็บ จานแม่เหล็กเช่น ดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM
3.โครงสร้างแฟ้มแบบ ลำดับเชิงดรรชนี
ข้อดี - สามารถรองรับการประมวลผลได้ทั้ง 2 แบบคือ แบบลำดับและแบบสุ่ม
- เหมาะกับงานธุรกรรมออนไลน์ ด้วยเช่นเดียวกัน
- เหมาะกับงานธุรกรรมออนไลน์ ด้วยเช่นเดียวกัน
ข้อเสีย - สิ้นเปลืองเนื้อที่ในการจัดเก็บดรรชนีที่ใช้อ้างอิงถึงตำแหน่งของข้อมูล
- การเขียนโปรแกรมเพื่อค้นหาข้อมูลจะซับซ้อน
- การทำงานช้ากว่าแบบสุ่ม และมีค่าใช้จ่ายสูง
สื่อที่ใช้เก็บจานแม่เหล็ก เช่น ดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM
ประเภทของแฟ้มข้อมูล File type
นอกจากจะแบ่งแฟ้มข้อมูลที่มีตามรูปแบบหรือโครงสร้างการจัดเก็บดังในหัวข้อนี้แล้ว เรายังอาจแบ่งประเภท ของแฟ้มข้อมูลตามลักษณะเนื้อหาของข้อมูลที่เก็บเป็น 2 ประเภท คือ
1. แฟ้มหลัก Master file แฟ้มหลัก เป็นแฟ้มข้อมูลที่มีความถี่ของการเปลี่ยนแปลงข้อมูลไม่บ่อยมากนัก แฟ้มหลักลูกค้าธนาคารซึ่งจะเก็บข้อมูลของลูกค้า เช่น ชื่อ ที่อยู่ หมายเลขบัญชี
2. แฟ้มรายการเปลี่ยนแปลง Transaction file แฟ้มรายการเปลี่ยนแปลง เป็นแฟ้มข้อมูลที่มีการเปลี่ยนหรือแก้ไขของรายการข้อมูลภายในค่อนข้างบ่อย และทำบัตรประจำตัวต่อเนื่องหรือเกิดขึ้นทุกวัน
ระบบฐานข้อมูล
จากปัญหาของการประมวลผลแฟ้มข้อมูลข้างต้น แนวคิดของการแก้ปัยหาดังกล่าวจะใช้วิธีการจัดเก็บรวบรวมแฟ้มข้อมูลที่มีความสัมพันธ์กันนำมาจัดเรียงรวมกันเสียใหม่อย่างเป็นระบบเพื่อให้สะดวกต่อการค้นหาและเรียกใช้ข้อมูลร่วมกัน โดยจัดทำเป็น ระบบฐานข้อมูล นั่นเอง

ระบบฐานข้อมูลสามารถใช้งานได้ทั้งกับเครื่องคอมพิวเตอร์เครื่องเดียว (Standalone)
เช่น ระบบฐานข้อมูลสินค้าคงคลังสำหรับองค์กรขนาดเล็กที่ต้องการจัดเก็บฐานข้อมูลสินค้าไว้เฉพาะในคอมพิวเตอร์เครื่องที่พนักงานบัญชีใช้เพียงเครื่องเดียว หรือจะประยุกต์ใช้กับเครื่องคอมพิวเตอร์แบบแม่ข่าย (Server) ผ่านระบบ LANหรืออินเตอร์เน็ตก็ได้ ทั้งนี้ขึ้นอยู่กับลักษณะของงานที่ต้องการเป็นหลัก ตัวอย่างของการใช้งานระบบฐานข้อมูลกับเครื่องคอมพิวเตอร์แม่ข่าย เช่น การประยุกต์ใช้ฐานข้อมูลบนเว็บ (web database) สำหรับการเก็บข้อมูลสินค้า ข้อมูลการสั่งซื้อ ข้อมูลยอดขาย ข้อมูลเกี่ยวกับการเรียน หรือข้อมูลอื่นๆที่ยินยอมให้ผู้ใช้เรียกดูข้อมูลเหล่านี้ได้ โดยผ่านเครือข่ายอินเทอร์เน็ตซึ่งใช้กันอย่างแพร่หลายในปัจจุบัน
การนำเอาระบบฐานข้อมูลมาใช้งานนั้นจะช่วยให้การทำงานมีความสะดวกมากยิ่งขึ้น หากต่างคนต่างเก็บข้อมูลเอง ไม่ได้นำมาเก็บรวมกันเป็นฐานข้อมูลกลาง อาจส่งผลให้เกิดปัญหาต่างๆตามมาอีกได้ เช่น ความซ้ำซ้อนของการจัดเก็บข้อมูล หรือปัญหาของข้อมูลที่ไม่ตรงกัน
การนำเอาระบบฐานข้อมูลมาใช้งานนั้นจะช่วยให้การทำงานมีความสะดวกมากยิ่งขึ้น หากต่างคนต่างเก็บข้อมูลเอง ไม่ได้นำมาเก็บรวมกันเป็นฐานข้อมูลกลาง อาจส่งผลให้เกิดปัญหาต่างๆตามมาอีกได้ เช่น ความซ้ำซ้อนของการจัดเก็บข้อมูล หรือปัญหาของข้อมูลที่ไม่ตรงกัน
การนำระบบฐานข้อมูลมาใช้จัดการกับข้อมูลนั้นมีแนวคิดที่ตั้งอยู่บนพื้นฐานดังนี้
- ลดความซ้ำซ้อนกันของข้อมูล (Reduced data redundancy)
- ลดความขัดแย้งของข้อมูล (
- ลดความขัดแย้งของข้อมูล (Reduced data inconsistency)
- การรักษาความคงสภาพของข้อมูล (
- การรักษาความคงสภาพของข้อมูล (Improved data integrity)
- ใช้ข้อมูลร่วมกันได้ (
- ใช้ข้อมูลร่วมกันได้ (Shared data)
- ง่ายต่อการเข้าถึงข้อมูล (
- ง่ายต่อการเข้าถึงข้อมูล (Easier access)
- ลดระยะเวลาการพัฒนาระบบงาน (
- ลดระยะเวลาการพัฒนาระบบงาน (Reduced development time)
นอกจากนี้ฐานข้อมูลยังช่วยในเรื่องการรักษาความปลอดภัยของข้อมูล โดยผู้ดูแลระบบจะสามารถกำหนดสิทธิ์ได้ว่าให้ใครหรือผู้ใช้คนใดทำอะไรได้หรือไม่ได้บ้าง เมื่อนำไปใช้ร่วมกับการพัฒนาระบบงานโปรแกรมฐานข้อมูล (Database application) ก็จะทำให้ระบบงานมีประสิทธิภาพมากขึ้นตามไปด้วย โดยผู้ใช้โปรแกรมในแต่ละระดับก็สามารถใช้งานได้แตกต่างกัน
นอกจากนี้ฐานข้อมูลยังช่วยในเรื่องการรักษาความปลอดภัยของข้อมูล โดยผู้ดูแลระบบจะสามารถกำหนดสิทธิ์ได้ว่าให้ใครหรือผู้ใช้คนใดทำอะไรได้หรือไม่ได้บ้าง เมื่อนำไปใช้ร่วมกับการพัฒนาระบบงานโปรแกรมฐานข้อมูล (Database application) ก็จะทำให้ระบบงานมีประสิทธิภาพมากขึ้นตามไปด้วย โดยผู้ใช้โปรแกรมในแต่ละระดับก็สามารถใช้งานได้แตกต่างกัน
เครื่องมือสำหรับจัดการฐานข้อมูล (DBMS)
โดยปกติในการจัดการฐานข้อมูลด้วยคอมพิวเตอร์นั้นจะมีโปรแกรมที่เรียกว่า ระบบการจัดการฐานข้อมูลหรือ DBMS (Database Management Systems) ซึ่งเปรียบเสมือนเป็นผู้จัดการฐานข้อมูลนั่นเอง โปรแกรมประเภทนี้มีการผลิตออกมาหลายระบบด้วยกัน แต่ที่ได้รับความนิยมและเป็นที่รู้จักกันดีคือ ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์หรือ RDBMS (Relational Database
ลักษณะของ DBMS
DBMS เป็นเหมือนตัวกลางที่ยอมให้ผู้ใช้เข้าค้นคืนข้อมูลได้โดยมีเครื่องมือสำคัยคือ ภาษาที่ใช้จัดการกับข้อมูลโดยเฉพาะเรียกว่า ภาษาเรียกค้นข้อมูล หรือ ภาษาคิวรี่ (query language) ซึ่งประกอบด้วยคำสั่งสำหรับเรียกใช้ข้อมูล แก้ไขเปลี่ยนแปลงหรือลบข้อมูล และยังสามารถนำไปใช้ร่วมกับการพัฒนาโปรแกรมประยุกต์ทางด้านฐานข้อมูล (Database application) ได้เป็นอย่างดี
ภาษาคิวรี่ (Query language) เป็นภาษาที่ใช้สำหรับสอบถามหรือจัดการฐานข้อมูลใน DBMS โดยภาษาประเภทนี้ที่ได้รับความนิยมสูงสุดคือ ภาษาSQL (Structure Query language ) คิดค้นโดยนักวิทยาศาสตร์ของไอบีเอ็มในทศวรรษที่ 1970 มีรูปแบบคำสั่งที่คล้ายกับประโยคในภาษาอังกฤษมาก ซึ่งปัจจุบันองค์กร ANSI (American National Standard Institute) ได้ประกาศให้ SQL เป็นภาษามาตรฐานสำหรับสำหรับระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ (Relational Database Management System หรือ RDBMS) ซึ่งเป็นระบบ DBMSแบบที่ใช้กันแพร่หลายที่สุดในปัจจุบัน
ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ ทุกระบบจะใช้คำสั่งพื้นฐานของภาษาSQL ได้เหมือนกันแต่อาจมีคำสั่งพิเศษที่แตกต่างกันบ้าง เนื่องจากบริษัทผู้ผลิตแต่ละรายก็พยายามทีจะพัฒนา RDBMS ของตนเองให้มีลักษณะที่เด่นกว่าระบบอื่นโดยเพิ่มคุณสมบัติที่เกินข้อจำกัดของ ANSI ซึ่งคิดว่าเป็นประโยชน์ต่อผู้ใช้เข้าไป ตัวอย่างของคำสั่ง SQL มีดังนี้
ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ ทุกระบบจะใช้คำสั่งพื้นฐานของภาษาSQL ได้เหมือนกันแต่อาจมีคำสั่งพิเศษที่แตกต่างกันบ้าง เนื่องจากบริษัทผู้ผลิตแต่ละรายก็พยายามทีจะพัฒนา RDBMS ของตนเองให้มีลักษณะที่เด่นกว่าระบบอื่นโดยเพิ่มคุณสมบัติที่เกินข้อจำกัดของ ANSI ซึ่งคิดว่าเป็นประโยชน์ต่อผู้ใช้เข้าไป ตัวอย่างของคำสั่ง SQL มีดังนี้
DELETE ใช้สำหรับลบข้อมูลหรือลบเรคคอร์ดใดๆในฐานข้อมูล
INSERT ใช้สำหรับเพิ่มข้อมูลหรือเพิ่มเรคคอร์ดใดๆในฐานข้อมูล
SELECT ใช้สำหรับเลือกข้อมูลหรือเลือกเรคคอร์ดใดๆที่ต้องการจากฐานข้อมูล
UPDATE ใช้สำหรับแก้ไขข้อมูลหรือแก้ไขเรคคอร์ดใดๆในฐานข้อมูล
แผนผังความสามารถโดยทั่วไปของระบบการจัดการฐานข้อมูล

สรุป
ข้อมูล ( Data or raw data) หมายถึง ข้อเท็จจริงต่างๆ (fact) ที่เกิดขึ้น ที่มีอยู่ในโลก ใช้แทนด้วยตัวเลข ภาษา หรือสัญลักษณ์ที่ยังไม่มีการปรุงแต่งหรือประมวลไดๆ )ถ้าเห็นนคำว่าข้อมูลในทางคอมพิวเตอร์ จะหมายถึงข้อเท็จจริงที่มีการรวบรวมไว้และมีความหมายในตัวเอง
สารสนเทศ (Information) หมายถึง การนำเสนอข้อมูลที่เก็บรวบรวมไว้ มาผ่านกระบวนการ (process) เพื่อให้ได้ผลลัพธ์ที่มีประโยชน์ต่อการตัดสินใจ หรือหมายถึงข้อมูลที่ได้ถูกกระทำให้มีความสัมพันธ์ หรือมีความหมายนำไปใช้ประโยชน์ได้
ความสำคัญของสารสนเทศ
สารสนเทศมีความสำคัญและเป็นประโยชน์ต่อการจัดการทุกระดับขององค์การ ทั้งในการปฏิบัติงาน และการบริการ ใช้ช่วยในนการตัดสินใจ การวางแผน และการประเมินผลเปรียบเทียบช่วยเพิ่มระดับความรู้ (Knoeladge) ความเข้าาใจเกี่ยวกับข้อเท็จจริง สารสนเทศจะมีค่าหรือความหมายมากขึ้นเมื่อมีการใช้งานมากขึ้นและสารสนเทศนั้นส่งผลกระทบถถึงการตัดสินใจหรือการกระทำที่ดำเนินการ
ข้อมูลและสารสนเทศในความหมายของผู้ใช้
ผู้ใช้ข้อมูลและสารสนเทศแต่ละคน จะมีการรับรู้ต่อข้อมูลและสารสนเทศเดียวกันแตกต่างกันไปตามลักษณะของการใช้งานและหน้าที่ความรับผิดชอบ สารสนเทศสำหรับคนๆหนึ่่งอาจเป็นข้อมูลดิบสำหรับคนอื่นก็ได้ เช่น ใบสั่งให้ส่งเอกสาร เป็นสารสนเทศของพนักงานส่งเอกสาร แต่เป็นข้อมูลดิบของงานสารบรรณ ตัวอย่างการดำเนินการเกี่ยวกับเอกสารใบสั่งซื้อสินค้า จะมีความหมายและคุณค่าต่อผู้ที่เกี่ยวข้องแตกต่างกันออกไปตามหน้าที่ที่ต้องปฏิบัติ ดังนี้
1.พนักงานขาย ถือว่าใบสั่งซื้อสินค้าที่ได้จากลูกค้าเป็นสารสนเทศของเขา เพราาะเขาจะต้องจัดสินค้าตามรายการนั้น
2.ผู้จัดการฝ่ายขาย ถือว่าใบสั่งซื้อสินค้าที่ได้จากลูกค้า เป็นข้อมูลของเขา แต่เมื่อนำใบสั่งซื้อทั้งหมกกมาาประมวลสรุปเป็นรายงานประจำเดือนจึงจัดเป็นสารสนเทศของเขา
3.พนักงานบัญชี ถือว่าใบสั่งซื้อสินค้าเป็นข้อมูลแต่เมื้อใบสั่งซื้อสินค้านี้ถูกดำเนินการต่อให้เป็นใบส่งของ สำหรับนำไปเก็บเงินลูกค้าและทำบันทึกบัญชีต่อไป จึงจะเป็นสารสนเทศของเขา ซึงจะได้เป็นบัญชีลูกหนี้ บัญชีเงินสด และรายได้จากการขายสินค้า ซึ่งเกิดจากข้อมูลในใบสั่งซื้อนั้น
4.พนักงานอื่นๆ เช่น วิศวกร นักวิจัย ถือว่าใบสั่งซื้อสินค้าเป็นเพียงข้อมูลที่่เขาไม่ต้องเกี่ยวข้องด้วยโดยตรง
ค่าแรงของลูกจ้างต่อสัปดาห์ เป็นสารสนเทศของลูกจ้างแต่ละคนที่จะได้รับค่าแรงแต่เป็นข้อมูลของผู้บริหาร และเมื่อรวมค่าแรงทั้งหมดที่ต้องจ่ายใน1 สัปดาห์แล้ว จึงจะถือว่าเป็นสารสนเทศสำหรับผู้บริหาร
ไม่มีความคิดเห็น:
แสดงความคิดเห็น