logo
แบนเนอร์ แบนเนอร์

รายละเอียดบล็อก

Created with Pixso. บ้าน Created with Pixso. Blog Created with Pixso.

คุณสมบัติ NAS ของ X67: แนวคิด หลักการ และการใช้งานของเทคโนโลยี RAID

คุณสมบัติ NAS ของ X67: แนวคิด หลักการ และการใช้งานของเทคโนโลยี RAID

2025-01-07

RAID (Redundant Array of Independent Disks) เดิมรู้จักกันในชื่อ Redundant Array of Inexpensive Disks ถูกเสนอครั้งแรกโดยศาสตราจารย์ DA Patterson จาก University of California, Berkeley ในบทความเรื่อง "A Case of Redundant Array of Inexpensive Disks" ในปี 1988 เวลา ดิสก์ความจุสูงมีราคาแพง ดังนั้นแนวคิดพื้นฐานของ RAID คือการรวมดิสก์ความจุขนาดเล็กหลายตัวเข้าด้วยกันและมีราคาไม่แพงนักเพื่อให้ได้ความจุ ประสิทธิภาพ และความน่าเชื่อถือที่เทียบเท่ากับ ดิสก์ความจุขนาดใหญ่ราคาแพงด้วยต้นทุนที่ต่ำกว่า เนื่องจากราคาและราคาของดิสก์ลดลงอย่างต่อเนื่อง คำว่า "ไม่แพง" จึงไม่มีความหมาย และ RAID Advisory Board (RAB) จึงตัดสินใจเปลี่ยน "ราคาไม่แพง" เป็น "อิสระ"

 

แนวคิดการออกแบบ RAID นี้ได้รับการยอมรับอย่างรวดเร็วจากอุตสาหกรรม เทคโนโลยี RAID ซึ่งเป็นเทคโนโลยีการจัดเก็บข้อมูลที่มีประสิทธิภาพสูงและเชื่อถือได้สูงได้ถูกนำไปใช้อย่างกว้างขวาง RAID ใช้เทคโนโลยี data striping การทำมิเรอร์ และพาริตี้ข้อมูลเป็นหลัก เพื่อให้เกิดประสิทธิภาพ ความน่าเชื่อถือ ความทนทานต่อข้อผิดพลาด และความสามารถในการปรับขนาดในระดับสูง ตามกลยุทธ์และสถาปัตยกรรมของการใช้หรือรวมเทคโนโลยีทั้งสามนี้ RAID สามารถแบ่งออกเป็นระดับต่างๆ เพื่อตอบสนองความต้องการของแอปพลิเคชันข้อมูลที่แตกต่างกัน ระดับ RAID ดั้งเดิม RAID1-RAID5 ถูกกำหนดไว้ในรายงานโดย DA Patterson และคณะ และ RAID0 และ RAID6 ได้ถูกขยายออกไปตั้งแต่ปี 1988 ในช่วงไม่กี่ปีที่ผ่านมา ผู้จำหน่ายอุปกรณ์จัดเก็บข้อมูลได้เปิดตัวระดับ RAID อย่างต่อเนื่อง เช่น RAID7, RAID10/01, RAID50, RAID53 และ RAID100 แต่ไม่มีมาตรฐานแบบครบวงจร ปัจจุบัน มาตรฐานที่อุตสาหกรรมยอมรับคือ RAID0-RAID5 และสี่ระดับยกเว้น RAID2 ได้รับการกำหนดให้เป็นมาตรฐานอุตสาหกรรม ระดับ RAID ที่ใช้บ่อยที่สุดในฟิลด์แอปพลิเคชันจริงคือ RAID0, RAID1, RAID3, RAID5, RAID6 และ RAID10

 

จากมุมมองของการใช้งาน RAID แบ่งออกเป็นสามประเภทหลักๆ ได้แก่ ซอฟต์แวร์ RAID, ฮาร์ดแวร์ RAID และ Hybrid RAID สำหรับซอฟต์แวร์ RAID ฟังก์ชั่นทั้งหมดจะเสร็จสมบูรณ์โดยระบบปฏิบัติการและ CPU และไม่มีชิปควบคุม/ประมวลผล RAID และชิปประมวลผล I/O อิสระ ดังนั้นประสิทธิภาพจึงต่ำที่สุด ฮาร์ดแวร์ RAID มาพร้อมกับชิปควบคุม/ประมวลผล RAID พิเศษ และชิปประมวลผล I/O รวมถึงบัฟเฟอร์อาร์เรย์ และไม่ใช้ทรัพยากรของ CPU แต่มีต้นทุนที่สูงมาก Hybrid RAID มีชิปควบคุม/ประมวลผล RAID แต่ไม่มีชิปประมวลผล I/O และต้องการให้ CPU และโปรแกรมไดรเวอร์ดำเนินการให้เสร็จสิ้น ประสิทธิภาพและต้นทุนอยู่ระหว่าง Software RAID และ Hardware RAID

 

ระดับ RAID แต่ละระดับแสดงถึงวิธีการนำไปใช้และเทคโนโลยี และไม่มีความแตกต่างระหว่างระดับสูงและต่ำ ในการใช้งานจริง ควรเลือกระดับ RAID ที่เหมาะสมและวิธีการใช้งานเฉพาะตามลักษณะของแอปพลิเคชันข้อมูลผู้ใช้ และควรพิจารณาความพร้อมใช้งาน ประสิทธิภาพ และต้นทุนอย่างครอบคลุม

 

หลักการพื้นฐาน

 

RAID หรือที่เรียกกันว่า Redundant Array of Independent Disks มักจะใช้ตัวย่อว่า Disk Array โดยสรุป RAID คือระบบย่อยของดิสก์ที่ประกอบด้วยดิสก์ไดรฟ์ประสิทธิภาพสูงอิสระหลายตัว ซึ่งให้ประสิทธิภาพการจัดเก็บข้อมูลและเทคโนโลยีการสำรองข้อมูลที่สูงกว่าดิสก์เพียงตัวเดียว RAID เป็นเทคโนโลยีการจัดการดิสก์หลายตัวที่ให้ความคุ้มค่า ความน่าเชื่อถือของข้อมูลสูง และพื้นที่จัดเก็บข้อมูลประสิทธิภาพสูงแก่สภาพแวดล้อมโฮสต์ คำจำกัดความของ RAID โดย SNIA คือ: ดิสก์อาร์เรย์ซึ่งส่วนหนึ่งของพื้นที่จัดเก็บข้อมูลทางกายภาพถูกใช้เพื่อบันทึกข้อมูลที่ซ้ำซ้อนของข้อมูลผู้ใช้ที่จัดเก็บไว้ในพื้นที่ที่เหลือ เมื่อดิสก์หรือเส้นทางการเข้าถึงล้มเหลว สามารถใช้ข้อมูลที่ซ้ำซ้อนเพื่อสร้างข้อมูลผู้ใช้ใหม่ได้ แม้ว่าการแบ่งดิสก์จะไม่เป็นไปตามคำจำกัดความของ RAID แต่ก็มักจะเรียกว่า RAID (เช่น RAID0)

 

ความตั้งใจดั้งเดิมของ RAID คือการจัดหาฟังก์ชันการจัดเก็บข้อมูลระดับไฮเอนด์และการรักษาความปลอดภัยข้อมูลสำรองสำหรับเซิร์ฟเวอร์ขนาดใหญ่ ในทั้งระบบ RAID ถือเป็นพื้นที่จัดเก็บข้อมูลที่ประกอบด้วยดิสก์ตั้งแต่สองตัวขึ้นไป และประสิทธิภาพ I/O ของระบบจัดเก็บข้อมูลได้รับการปรับปรุงโดยการอ่านและเขียนข้อมูลบนดิสก์หลายตัวพร้อมกัน ระดับ RAID ส่วนใหญ่มีมาตรการตรวจสอบและแก้ไขข้อมูลที่สมบูรณ์ และแม้แต่วิธีการมิเรอร์ ซึ่งเพิ่มความน่าเชื่อถือของระบบอย่างมาก และนั่นคือที่มาของ "ความซ้ำซ้อน"

 

ที่นี่เราต้องพูดถึง JBOD (เพียงพวงของดิสก์) เริ่มแรก JBOD ถูกใช้เพื่อแสดงคอลเลกชั่นดิสก์โดยไม่มีซอฟต์แวร์ควบคุมเพื่อให้การควบคุมแบบประสานงาน ซึ่งเป็นปัจจัยหลักที่ทำให้ RAID แตกต่างจาก JBOD ในปัจจุบัน JBOD มักอ้างถึงกล่องหุ้มดิสก์ ไม่ว่าจะมีฟังก์ชัน RAID หรือไม่ก็ตาม

 

วัตถุประสงค์หลักสองประการของ RAID คือการปรับปรุงความน่าเชื่อถือของข้อมูลและประสิทธิภาพ I/O ในดิสก์อาร์เรย์ ข้อมูลจะกระจัดกระจายไปตามดิสก์หลายแผ่น แต่สำหรับระบบคอมพิวเตอร์จะดูเหมือนดิสก์แผ่นเดียว การสำรองสามารถทำได้โดยการเขียนข้อมูลเดียวกันลงในดิสก์หลายตัว (โดยทั่วไปคือการมิเรอร์) หรือการเขียนข้อมูลพาริตีที่คำนวณแล้วลงในอาร์เรย์ เพื่อไม่ให้ข้อมูลสูญหายเมื่อดิสก์ตัวเดียวล้มเหลว RAID บางระดับยอมให้ดิสก์เสียหายได้มากขึ้นในเวลาเดียวกัน เช่น RAID6 ซึ่งดิสก์สองตัวอาจเสียหายได้ในเวลาเดียวกัน ภายใต้กลไกการสำรองดังกล่าว ดิสก์ที่ล้มเหลวจะถูกแทนที่ด้วยดิสก์ใหม่ และ RAID จะสร้างข้อมูลที่สูญหายขึ้นใหม่โดยอัตโนมัติตามข้อมูลและข้อมูลพาริตีในดิสก์ที่เหลือ เพื่อให้มั่นใจถึงความสอดคล้องและความสมบูรณ์ของข้อมูล ข้อมูลจะกระจัดกระจายและจัดเก็บไว้ในดิสก์หลายตัวใน RAID และการอ่านและเขียนข้อมูลพร้อมกันจะดีกว่าดิสก์แผ่นเดียวมาก จึงสามารถรับแบนด์วิธ I/O รวมที่สูงกว่าได้ แน่นอนว่า ดิสก์อาร์เรย์จะลดพื้นที่จัดเก็บข้อมูลที่มีอยู่ทั้งหมดของดิสก์ทั้งหมด โดยจะเสียสละพื้นที่เพื่อแลกกับความน่าเชื่อถือและประสิทธิภาพที่สูงขึ้น ตัวอย่างเช่น การใช้พื้นที่จัดเก็บข้อมูลของ RAID1 เพียง 50% และ RAID5 จะสูญเสียความจุของดิสก์หนึ่งดิสก์ และการใช้พื้นที่คือ (n-1)/n

 

ดิสก์อาร์เรย์สามารถรับประกันการทำงานอย่างต่อเนื่องของระบบโดยไม่หยุดชะงัก เมื่อดิสก์บางตัว (เดี่ยวหรือหลายตัว ขึ้นอยู่กับการใช้งาน) ได้รับความเสียหาย ในระหว่างกระบวนการสร้างข้อมูลของดิสก์ที่ล้มเหลวไปยังดิสก์ใหม่ ระบบสามารถทำงานต่อไปได้ตามปกติ แต่ประสิทธิภาพจะลดลงในระดับหนึ่ง ดิสก์อาร์เรย์บางตัวต้องปิดตัวลงเมื่อมีการเพิ่มหรือลบดิสก์ ในขณะที่บางตัวรองรับการสลับโดยไม่ต้องปิดเครื่อง ทำให้สามารถเปลี่ยนดิสก์ไดรฟ์ได้โดยไม่ต้องปิดเครื่อง ดิสก์อาร์เรย์ระดับไฮเอนด์นี้ส่วนใหญ่จะใช้ในระบบแอปพลิเคชันที่มีความต้องการความน่าเชื่อถือสูง และระบบไม่สามารถปิดระบบได้หรือเวลาปิดระบบควรสั้นที่สุดเท่าที่จะทำได้ โดยทั่วไปแล้ว RAID ไม่สามารถแทนที่การสำรองข้อมูลได้ ไม่มีอำนาจใด ๆ สำหรับการสูญหายของข้อมูลที่เกิดจากความล้มเหลวที่ไม่ใช่ดิสก์ เช่น ไวรัส การทำลายโดยมนุษย์ การลบโดยไม่ตั้งใจ ฯลฯ ในขณะนี้ การสูญเสียข้อมูลจะสัมพันธ์กับระบบปฏิบัติการ ระบบไฟล์ ตัวจัดการโวลุ่ม หรือระบบแอปพลิเคชัน สำหรับระบบ RAID เอง ข้อมูลจะยังคงอยู่และไม่มีการสูญเสียเกิดขึ้น ดังนั้นการสำรองข้อมูล การกู้คืนระบบ และมาตรการปกป้องข้อมูลอื่นๆ จึงจำเป็นอย่างยิ่ง ซึ่งจะช่วยเสริม RAID และปกป้องความปลอดภัยของข้อมูลในระดับต่างๆ เพื่อป้องกันข้อมูลสูญหาย

 

มีแนวคิดและเทคโนโลยีหลักสามประการใน RAID: การทำมิเรอร์ แถบข้อมูล และพาริตี้ข้อมูล การมิเรอร์จะคัดลอกข้อมูลไปยังดิสก์หลายแผ่น ในด้านหนึ่ง สามารถปรับปรุงความน่าเชื่อถือได้ และในทางกลับกัน ก็สามารถอ่านข้อมูลจากสำเนาสองชุดขึ้นไปพร้อมกันได้ เพื่อปรับปรุงประสิทธิภาพการอ่าน แน่นอนว่าประสิทธิภาพการเขียนของการมิเรอร์จะลดลงเล็กน้อย และต้องใช้เวลามากขึ้นเพื่อให้แน่ใจว่าข้อมูลถูกเขียนลงดิสก์หลายแผ่นอย่างถูกต้อง การแยกส่วนข้อมูลจะจัดเก็บชิ้นข้อมูลไว้บนดิสก์ที่แตกต่างกันหลายชิ้น และชิ้นข้อมูลหลายชิ้นรวมกันเป็นสำเนาข้อมูลที่สมบูรณ์ ซึ่งแตกต่างจากสำเนาของการมิเรอร์หลายชุด และโดยปกติจะใช้สำหรับการพิจารณาประสิทธิภาพ การแยกข้อมูลมีรายละเอียดการทำงานพร้อมกันที่สูงกว่า เมื่อเข้าถึงข้อมูล เป็นไปได้ที่จะอ่านและเขียนข้อมูลบนดิสก์ที่แตกต่างกันในเวลาเดียวกัน ดังนั้นจึงได้รับการปรับปรุงประสิทธิภาพ I/O อย่างมีนัยสำคัญมาก ความเท่าเทียมกันของข้อมูลใช้ข้อมูลที่ซ้ำซ้อนสำหรับการตรวจจับและซ่อมแซมข้อผิดพลาดของข้อมูล ข้อมูลที่ซ้ำซ้อนมักจะคำนวณโดยอัลกอริธึม เช่น รหัส Hamming และการดำเนินการ XOR การใช้ฟังก์ชันพาริตีสามารถปรับปรุงความน่าเชื่อถือ ความทนทาน และความทนทานต่อข้อผิดพลาดของดิสก์อาเรย์ได้อย่างมาก อย่างไรก็ตาม ความเท่าเทียมกันของข้อมูลจำเป็นต้องอ่านข้อมูลจากหลายแห่ง และทำการคำนวณและการเปรียบเทียบ ซึ่งจะส่งผลต่อประสิทธิภาพของระบบ RAID ระดับต่างๆ จะใช้เทคโนโลยีหนึ่งหรือหลายจากสามเทคโนโลยีข้างต้นเพื่อให้ได้ความน่าเชื่อถือของข้อมูล ความพร้อมใช้งาน และประสิทธิภาพ I/O ที่แตกต่างกัน สำหรับ RAID ประเภทใด (แม้แต่ระดับหรือประเภทใหม่) ที่จะออกแบบหรือโหมดใดของ RAID ที่จะนำมาใช้ จำเป็นต้องตัดสินใจอย่างสมเหตุสมผลภายใต้สมมติฐานของการทำความเข้าใจความต้องการของระบบอย่างลึกซึ้ง และประเมินความน่าเชื่อถือ ประสิทธิภาพ และต้นทุนอย่างครอบคลุม ตัดสินใจประนีประนอม

 

ข้อดีของการโจมตี

 

  • ความจุขนาดใหญ่: นี่เป็นข้อได้เปรียบที่ชัดเจนของ RAID มันขยายความจุของดิสก์ และระบบ RAID ที่ประกอบด้วยดิสก์หลายตัวก็มีพื้นที่จัดเก็บข้อมูลขนาดใหญ่ ขณะนี้ความจุของดิสก์เดียวสามารถเข้าถึงได้มากกว่า 1TB ดังนั้นความจุของ RAID จึงสามารถเข้าถึงระดับ PB และสามารถตอบสนองความต้องการในการจัดเก็บข้อมูลส่วนใหญ่ได้ โดยทั่วไป ความจุที่มีอยู่ของ RAID จะน้อยกว่าความจุรวมของดิสก์สมาชิกทั้งหมด อัลกอริธึม RAID ระดับต่างๆ จำเป็นต้องมีโอเวอร์เฮดสำรอง และโอเวอร์เฮดความจุเฉพาะนั้นสัมพันธ์กับอัลกอริธึมที่นำมาใช้ หากทราบอัลกอริทึมและความจุของ RAID จะสามารถคำนวณความจุที่มีอยู่ของ RAID ได้ โดยปกติแล้ว การใช้ความจุของ RAID จะอยู่ระหว่าง 50% ถึง 90%

  • ประสิทธิภาพสูง: ประสิทธิภาพสูงของ RAID ได้รับประโยชน์จากเทคโนโลยี data striping ประสิทธิภาพ I/O ของดิสก์แผ่นเดียวถูกจำกัดด้วยเทคโนโลยีคอมพิวเตอร์ เช่น อินเทอร์เฟซและแบนด์วิธ และมักเป็นปัญหาคอขวดของประสิทธิภาพของระบบ ด้วยการสตริปข้อมูล RAID จะกระจายข้อมูล I/O ไปยังดิสก์สมาชิกแต่ละตัว ดังนั้นจึงได้รับประสิทธิภาพ I/O แบบรวมที่สูงกว่าดิสก์เดี่ยวหลายเท่า

  • ความน่าเชื่อถือ: ความพร้อมใช้งานและความน่าเชื่อถือเป็นคุณสมบัติที่สำคัญอีกประการหนึ่งของ RAID ตามทฤษฎีแล้ว ความน่าเชื่อถือของระบบ RAID ที่ประกอบด้วยดิสก์หลายตัวควรจะแย่กว่าความน่าเชื่อถือของดิสก์ตัวเดียว มีข้อสันนิษฐานโดยนัยดังนี้: ความล้มเหลวของดิสก์เพียงตัวเดียวจะทำให้ RAID ทั้งหมดไม่พร้อมใช้งาน RAID ใช้เทคโนโลยีการสำรองข้อมูล เช่น การทำมิเรอร์และพาริตี้ข้อมูลเพื่อทำลายสมมติฐานนี้ การทำมิเรอร์เป็นเทคโนโลยีการสำรองข้อมูลแบบดั้งเดิมที่สุด ซึ่งจะคัดลอกข้อมูลบนดิสก์ไดรฟ์บางกลุ่มไปยังดิสก์ไดรฟ์อีกกลุ่มหนึ่งโดยสมบูรณ์ เพื่อให้แน่ใจว่าจะมีสำเนาข้อมูลอยู่เสมอ เมื่อเปรียบเทียบกับค่าใช้จ่ายในการทำซ้ำ 50% ของการมิเรอร์ ความเท่าเทียมกันของข้อมูลจะมีน้อยกว่ามาก และใช้ข้อมูลความซ้ำซ้อนของความเท่าเทียมกันในการตรวจสอบและแก้ไขข้อมูล เทคโนโลยีการสำรองข้อมูลของ RAID ช่วยปรับปรุงความพร้อมใช้งานและความน่าเชื่อถือของข้อมูลได้อย่างมาก และช่วยให้มั่นใจได้ว่าเมื่อดิสก์หลายตัวล้มเหลว ข้อมูลจะไม่สูญหาย และการทำงานอย่างต่อเนื่องของระบบจะไม่ได้รับผลกระทบ

  • ความสามารถในการจัดการ: อันที่จริง RAID เป็นเทคโนโลยีการจำลองเสมือนที่สร้างดิสก์ไดรฟ์จริงหลายตัวให้เป็นไดรฟ์ลอจิคัลความจุขนาดใหญ่ สำหรับระบบโฮสต์ภายนอก RAID เป็นดิสก์ไดรฟ์ความจุขนาดใหญ่ตัวเดียวที่รวดเร็วและเชื่อถือได้ ด้วยวิธีนี้ผู้ใช้สามารถจัดระเบียบและจัดเก็บข้อมูลระบบแอปพลิเคชันบนไดรฟ์เสมือนนี้ได้ จากมุมมองของแอปพลิเคชันของผู้ใช้ สามารถทำให้ระบบจัดเก็บข้อมูลเรียบง่ายและใช้งานง่ายและจัดการได้ เนื่องจาก RAID ได้เสร็จสิ้นการจัดการพื้นที่จัดเก็บข้อมูลจำนวนมากภายในแล้ว ผู้ดูแลระบบจึงจำเป็นต้องจัดการไดรฟ์เสมือนเพียงไดรฟ์เดียวเท่านั้น ซึ่งสามารถบันทึกงานการจัดการได้จำนวนมาก RAID สามารถเพิ่มหรือลบดิสก์ไดรฟ์แบบไดนามิก และดำเนินการตรวจสอบข้อมูลและการสร้างข้อมูลใหม่โดยอัตโนมัติ ซึ่งช่วยให้งานการจัดการง่ายขึ้นอย่างมาก

แบนเนอร์
รายละเอียดบล็อก
Created with Pixso. บ้าน Created with Pixso. Blog Created with Pixso.

คุณสมบัติ NAS ของ X67: แนวคิด หลักการ และการใช้งานของเทคโนโลยี RAID

คุณสมบัติ NAS ของ X67: แนวคิด หลักการ และการใช้งานของเทคโนโลยี RAID

RAID (Redundant Array of Independent Disks) เดิมรู้จักกันในชื่อ Redundant Array of Inexpensive Disks ถูกเสนอครั้งแรกโดยศาสตราจารย์ DA Patterson จาก University of California, Berkeley ในบทความเรื่อง "A Case of Redundant Array of Inexpensive Disks" ในปี 1988 เวลา ดิสก์ความจุสูงมีราคาแพง ดังนั้นแนวคิดพื้นฐานของ RAID คือการรวมดิสก์ความจุขนาดเล็กหลายตัวเข้าด้วยกันและมีราคาไม่แพงนักเพื่อให้ได้ความจุ ประสิทธิภาพ และความน่าเชื่อถือที่เทียบเท่ากับ ดิสก์ความจุขนาดใหญ่ราคาแพงด้วยต้นทุนที่ต่ำกว่า เนื่องจากราคาและราคาของดิสก์ลดลงอย่างต่อเนื่อง คำว่า "ไม่แพง" จึงไม่มีความหมาย และ RAID Advisory Board (RAB) จึงตัดสินใจเปลี่ยน "ราคาไม่แพง" เป็น "อิสระ"

 

แนวคิดการออกแบบ RAID นี้ได้รับการยอมรับอย่างรวดเร็วจากอุตสาหกรรม เทคโนโลยี RAID ซึ่งเป็นเทคโนโลยีการจัดเก็บข้อมูลที่มีประสิทธิภาพสูงและเชื่อถือได้สูงได้ถูกนำไปใช้อย่างกว้างขวาง RAID ใช้เทคโนโลยี data striping การทำมิเรอร์ และพาริตี้ข้อมูลเป็นหลัก เพื่อให้เกิดประสิทธิภาพ ความน่าเชื่อถือ ความทนทานต่อข้อผิดพลาด และความสามารถในการปรับขนาดในระดับสูง ตามกลยุทธ์และสถาปัตยกรรมของการใช้หรือรวมเทคโนโลยีทั้งสามนี้ RAID สามารถแบ่งออกเป็นระดับต่างๆ เพื่อตอบสนองความต้องการของแอปพลิเคชันข้อมูลที่แตกต่างกัน ระดับ RAID ดั้งเดิม RAID1-RAID5 ถูกกำหนดไว้ในรายงานโดย DA Patterson และคณะ และ RAID0 และ RAID6 ได้ถูกขยายออกไปตั้งแต่ปี 1988 ในช่วงไม่กี่ปีที่ผ่านมา ผู้จำหน่ายอุปกรณ์จัดเก็บข้อมูลได้เปิดตัวระดับ RAID อย่างต่อเนื่อง เช่น RAID7, RAID10/01, RAID50, RAID53 และ RAID100 แต่ไม่มีมาตรฐานแบบครบวงจร ปัจจุบัน มาตรฐานที่อุตสาหกรรมยอมรับคือ RAID0-RAID5 และสี่ระดับยกเว้น RAID2 ได้รับการกำหนดให้เป็นมาตรฐานอุตสาหกรรม ระดับ RAID ที่ใช้บ่อยที่สุดในฟิลด์แอปพลิเคชันจริงคือ RAID0, RAID1, RAID3, RAID5, RAID6 และ RAID10

 

จากมุมมองของการใช้งาน RAID แบ่งออกเป็นสามประเภทหลักๆ ได้แก่ ซอฟต์แวร์ RAID, ฮาร์ดแวร์ RAID และ Hybrid RAID สำหรับซอฟต์แวร์ RAID ฟังก์ชั่นทั้งหมดจะเสร็จสมบูรณ์โดยระบบปฏิบัติการและ CPU และไม่มีชิปควบคุม/ประมวลผล RAID และชิปประมวลผล I/O อิสระ ดังนั้นประสิทธิภาพจึงต่ำที่สุด ฮาร์ดแวร์ RAID มาพร้อมกับชิปควบคุม/ประมวลผล RAID พิเศษ และชิปประมวลผล I/O รวมถึงบัฟเฟอร์อาร์เรย์ และไม่ใช้ทรัพยากรของ CPU แต่มีต้นทุนที่สูงมาก Hybrid RAID มีชิปควบคุม/ประมวลผล RAID แต่ไม่มีชิปประมวลผล I/O และต้องการให้ CPU และโปรแกรมไดรเวอร์ดำเนินการให้เสร็จสิ้น ประสิทธิภาพและต้นทุนอยู่ระหว่าง Software RAID และ Hardware RAID

 

ระดับ RAID แต่ละระดับแสดงถึงวิธีการนำไปใช้และเทคโนโลยี และไม่มีความแตกต่างระหว่างระดับสูงและต่ำ ในการใช้งานจริง ควรเลือกระดับ RAID ที่เหมาะสมและวิธีการใช้งานเฉพาะตามลักษณะของแอปพลิเคชันข้อมูลผู้ใช้ และควรพิจารณาความพร้อมใช้งาน ประสิทธิภาพ และต้นทุนอย่างครอบคลุม

 

หลักการพื้นฐาน

 

RAID หรือที่เรียกกันว่า Redundant Array of Independent Disks มักจะใช้ตัวย่อว่า Disk Array โดยสรุป RAID คือระบบย่อยของดิสก์ที่ประกอบด้วยดิสก์ไดรฟ์ประสิทธิภาพสูงอิสระหลายตัว ซึ่งให้ประสิทธิภาพการจัดเก็บข้อมูลและเทคโนโลยีการสำรองข้อมูลที่สูงกว่าดิสก์เพียงตัวเดียว RAID เป็นเทคโนโลยีการจัดการดิสก์หลายตัวที่ให้ความคุ้มค่า ความน่าเชื่อถือของข้อมูลสูง และพื้นที่จัดเก็บข้อมูลประสิทธิภาพสูงแก่สภาพแวดล้อมโฮสต์ คำจำกัดความของ RAID โดย SNIA คือ: ดิสก์อาร์เรย์ซึ่งส่วนหนึ่งของพื้นที่จัดเก็บข้อมูลทางกายภาพถูกใช้เพื่อบันทึกข้อมูลที่ซ้ำซ้อนของข้อมูลผู้ใช้ที่จัดเก็บไว้ในพื้นที่ที่เหลือ เมื่อดิสก์หรือเส้นทางการเข้าถึงล้มเหลว สามารถใช้ข้อมูลที่ซ้ำซ้อนเพื่อสร้างข้อมูลผู้ใช้ใหม่ได้ แม้ว่าการแบ่งดิสก์จะไม่เป็นไปตามคำจำกัดความของ RAID แต่ก็มักจะเรียกว่า RAID (เช่น RAID0)

 

ความตั้งใจดั้งเดิมของ RAID คือการจัดหาฟังก์ชันการจัดเก็บข้อมูลระดับไฮเอนด์และการรักษาความปลอดภัยข้อมูลสำรองสำหรับเซิร์ฟเวอร์ขนาดใหญ่ ในทั้งระบบ RAID ถือเป็นพื้นที่จัดเก็บข้อมูลที่ประกอบด้วยดิสก์ตั้งแต่สองตัวขึ้นไป และประสิทธิภาพ I/O ของระบบจัดเก็บข้อมูลได้รับการปรับปรุงโดยการอ่านและเขียนข้อมูลบนดิสก์หลายตัวพร้อมกัน ระดับ RAID ส่วนใหญ่มีมาตรการตรวจสอบและแก้ไขข้อมูลที่สมบูรณ์ และแม้แต่วิธีการมิเรอร์ ซึ่งเพิ่มความน่าเชื่อถือของระบบอย่างมาก และนั่นคือที่มาของ "ความซ้ำซ้อน"

 

ที่นี่เราต้องพูดถึง JBOD (เพียงพวงของดิสก์) เริ่มแรก JBOD ถูกใช้เพื่อแสดงคอลเลกชั่นดิสก์โดยไม่มีซอฟต์แวร์ควบคุมเพื่อให้การควบคุมแบบประสานงาน ซึ่งเป็นปัจจัยหลักที่ทำให้ RAID แตกต่างจาก JBOD ในปัจจุบัน JBOD มักอ้างถึงกล่องหุ้มดิสก์ ไม่ว่าจะมีฟังก์ชัน RAID หรือไม่ก็ตาม

 

วัตถุประสงค์หลักสองประการของ RAID คือการปรับปรุงความน่าเชื่อถือของข้อมูลและประสิทธิภาพ I/O ในดิสก์อาร์เรย์ ข้อมูลจะกระจัดกระจายไปตามดิสก์หลายแผ่น แต่สำหรับระบบคอมพิวเตอร์จะดูเหมือนดิสก์แผ่นเดียว การสำรองสามารถทำได้โดยการเขียนข้อมูลเดียวกันลงในดิสก์หลายตัว (โดยทั่วไปคือการมิเรอร์) หรือการเขียนข้อมูลพาริตีที่คำนวณแล้วลงในอาร์เรย์ เพื่อไม่ให้ข้อมูลสูญหายเมื่อดิสก์ตัวเดียวล้มเหลว RAID บางระดับยอมให้ดิสก์เสียหายได้มากขึ้นในเวลาเดียวกัน เช่น RAID6 ซึ่งดิสก์สองตัวอาจเสียหายได้ในเวลาเดียวกัน ภายใต้กลไกการสำรองดังกล่าว ดิสก์ที่ล้มเหลวจะถูกแทนที่ด้วยดิสก์ใหม่ และ RAID จะสร้างข้อมูลที่สูญหายขึ้นใหม่โดยอัตโนมัติตามข้อมูลและข้อมูลพาริตีในดิสก์ที่เหลือ เพื่อให้มั่นใจถึงความสอดคล้องและความสมบูรณ์ของข้อมูล ข้อมูลจะกระจัดกระจายและจัดเก็บไว้ในดิสก์หลายตัวใน RAID และการอ่านและเขียนข้อมูลพร้อมกันจะดีกว่าดิสก์แผ่นเดียวมาก จึงสามารถรับแบนด์วิธ I/O รวมที่สูงกว่าได้ แน่นอนว่า ดิสก์อาร์เรย์จะลดพื้นที่จัดเก็บข้อมูลที่มีอยู่ทั้งหมดของดิสก์ทั้งหมด โดยจะเสียสละพื้นที่เพื่อแลกกับความน่าเชื่อถือและประสิทธิภาพที่สูงขึ้น ตัวอย่างเช่น การใช้พื้นที่จัดเก็บข้อมูลของ RAID1 เพียง 50% และ RAID5 จะสูญเสียความจุของดิสก์หนึ่งดิสก์ และการใช้พื้นที่คือ (n-1)/n

 

ดิสก์อาร์เรย์สามารถรับประกันการทำงานอย่างต่อเนื่องของระบบโดยไม่หยุดชะงัก เมื่อดิสก์บางตัว (เดี่ยวหรือหลายตัว ขึ้นอยู่กับการใช้งาน) ได้รับความเสียหาย ในระหว่างกระบวนการสร้างข้อมูลของดิสก์ที่ล้มเหลวไปยังดิสก์ใหม่ ระบบสามารถทำงานต่อไปได้ตามปกติ แต่ประสิทธิภาพจะลดลงในระดับหนึ่ง ดิสก์อาร์เรย์บางตัวต้องปิดตัวลงเมื่อมีการเพิ่มหรือลบดิสก์ ในขณะที่บางตัวรองรับการสลับโดยไม่ต้องปิดเครื่อง ทำให้สามารถเปลี่ยนดิสก์ไดรฟ์ได้โดยไม่ต้องปิดเครื่อง ดิสก์อาร์เรย์ระดับไฮเอนด์นี้ส่วนใหญ่จะใช้ในระบบแอปพลิเคชันที่มีความต้องการความน่าเชื่อถือสูง และระบบไม่สามารถปิดระบบได้หรือเวลาปิดระบบควรสั้นที่สุดเท่าที่จะทำได้ โดยทั่วไปแล้ว RAID ไม่สามารถแทนที่การสำรองข้อมูลได้ ไม่มีอำนาจใด ๆ สำหรับการสูญหายของข้อมูลที่เกิดจากความล้มเหลวที่ไม่ใช่ดิสก์ เช่น ไวรัส การทำลายโดยมนุษย์ การลบโดยไม่ตั้งใจ ฯลฯ ในขณะนี้ การสูญเสียข้อมูลจะสัมพันธ์กับระบบปฏิบัติการ ระบบไฟล์ ตัวจัดการโวลุ่ม หรือระบบแอปพลิเคชัน สำหรับระบบ RAID เอง ข้อมูลจะยังคงอยู่และไม่มีการสูญเสียเกิดขึ้น ดังนั้นการสำรองข้อมูล การกู้คืนระบบ และมาตรการปกป้องข้อมูลอื่นๆ จึงจำเป็นอย่างยิ่ง ซึ่งจะช่วยเสริม RAID และปกป้องความปลอดภัยของข้อมูลในระดับต่างๆ เพื่อป้องกันข้อมูลสูญหาย

 

มีแนวคิดและเทคโนโลยีหลักสามประการใน RAID: การทำมิเรอร์ แถบข้อมูล และพาริตี้ข้อมูล การมิเรอร์จะคัดลอกข้อมูลไปยังดิสก์หลายแผ่น ในด้านหนึ่ง สามารถปรับปรุงความน่าเชื่อถือได้ และในทางกลับกัน ก็สามารถอ่านข้อมูลจากสำเนาสองชุดขึ้นไปพร้อมกันได้ เพื่อปรับปรุงประสิทธิภาพการอ่าน แน่นอนว่าประสิทธิภาพการเขียนของการมิเรอร์จะลดลงเล็กน้อย และต้องใช้เวลามากขึ้นเพื่อให้แน่ใจว่าข้อมูลถูกเขียนลงดิสก์หลายแผ่นอย่างถูกต้อง การแยกส่วนข้อมูลจะจัดเก็บชิ้นข้อมูลไว้บนดิสก์ที่แตกต่างกันหลายชิ้น และชิ้นข้อมูลหลายชิ้นรวมกันเป็นสำเนาข้อมูลที่สมบูรณ์ ซึ่งแตกต่างจากสำเนาของการมิเรอร์หลายชุด และโดยปกติจะใช้สำหรับการพิจารณาประสิทธิภาพ การแยกข้อมูลมีรายละเอียดการทำงานพร้อมกันที่สูงกว่า เมื่อเข้าถึงข้อมูล เป็นไปได้ที่จะอ่านและเขียนข้อมูลบนดิสก์ที่แตกต่างกันในเวลาเดียวกัน ดังนั้นจึงได้รับการปรับปรุงประสิทธิภาพ I/O อย่างมีนัยสำคัญมาก ความเท่าเทียมกันของข้อมูลใช้ข้อมูลที่ซ้ำซ้อนสำหรับการตรวจจับและซ่อมแซมข้อผิดพลาดของข้อมูล ข้อมูลที่ซ้ำซ้อนมักจะคำนวณโดยอัลกอริธึม เช่น รหัส Hamming และการดำเนินการ XOR การใช้ฟังก์ชันพาริตีสามารถปรับปรุงความน่าเชื่อถือ ความทนทาน และความทนทานต่อข้อผิดพลาดของดิสก์อาเรย์ได้อย่างมาก อย่างไรก็ตาม ความเท่าเทียมกันของข้อมูลจำเป็นต้องอ่านข้อมูลจากหลายแห่ง และทำการคำนวณและการเปรียบเทียบ ซึ่งจะส่งผลต่อประสิทธิภาพของระบบ RAID ระดับต่างๆ จะใช้เทคโนโลยีหนึ่งหรือหลายจากสามเทคโนโลยีข้างต้นเพื่อให้ได้ความน่าเชื่อถือของข้อมูล ความพร้อมใช้งาน และประสิทธิภาพ I/O ที่แตกต่างกัน สำหรับ RAID ประเภทใด (แม้แต่ระดับหรือประเภทใหม่) ที่จะออกแบบหรือโหมดใดของ RAID ที่จะนำมาใช้ จำเป็นต้องตัดสินใจอย่างสมเหตุสมผลภายใต้สมมติฐานของการทำความเข้าใจความต้องการของระบบอย่างลึกซึ้ง และประเมินความน่าเชื่อถือ ประสิทธิภาพ และต้นทุนอย่างครอบคลุม ตัดสินใจประนีประนอม

 

ข้อดีของการโจมตี

 

  • ความจุขนาดใหญ่: นี่เป็นข้อได้เปรียบที่ชัดเจนของ RAID มันขยายความจุของดิสก์ และระบบ RAID ที่ประกอบด้วยดิสก์หลายตัวก็มีพื้นที่จัดเก็บข้อมูลขนาดใหญ่ ขณะนี้ความจุของดิสก์เดียวสามารถเข้าถึงได้มากกว่า 1TB ดังนั้นความจุของ RAID จึงสามารถเข้าถึงระดับ PB และสามารถตอบสนองความต้องการในการจัดเก็บข้อมูลส่วนใหญ่ได้ โดยทั่วไป ความจุที่มีอยู่ของ RAID จะน้อยกว่าความจุรวมของดิสก์สมาชิกทั้งหมด อัลกอริธึม RAID ระดับต่างๆ จำเป็นต้องมีโอเวอร์เฮดสำรอง และโอเวอร์เฮดความจุเฉพาะนั้นสัมพันธ์กับอัลกอริธึมที่นำมาใช้ หากทราบอัลกอริทึมและความจุของ RAID จะสามารถคำนวณความจุที่มีอยู่ของ RAID ได้ โดยปกติแล้ว การใช้ความจุของ RAID จะอยู่ระหว่าง 50% ถึง 90%

  • ประสิทธิภาพสูง: ประสิทธิภาพสูงของ RAID ได้รับประโยชน์จากเทคโนโลยี data striping ประสิทธิภาพ I/O ของดิสก์แผ่นเดียวถูกจำกัดด้วยเทคโนโลยีคอมพิวเตอร์ เช่น อินเทอร์เฟซและแบนด์วิธ และมักเป็นปัญหาคอขวดของประสิทธิภาพของระบบ ด้วยการสตริปข้อมูล RAID จะกระจายข้อมูล I/O ไปยังดิสก์สมาชิกแต่ละตัว ดังนั้นจึงได้รับประสิทธิภาพ I/O แบบรวมที่สูงกว่าดิสก์เดี่ยวหลายเท่า

  • ความน่าเชื่อถือ: ความพร้อมใช้งานและความน่าเชื่อถือเป็นคุณสมบัติที่สำคัญอีกประการหนึ่งของ RAID ตามทฤษฎีแล้ว ความน่าเชื่อถือของระบบ RAID ที่ประกอบด้วยดิสก์หลายตัวควรจะแย่กว่าความน่าเชื่อถือของดิสก์ตัวเดียว มีข้อสันนิษฐานโดยนัยดังนี้: ความล้มเหลวของดิสก์เพียงตัวเดียวจะทำให้ RAID ทั้งหมดไม่พร้อมใช้งาน RAID ใช้เทคโนโลยีการสำรองข้อมูล เช่น การทำมิเรอร์และพาริตี้ข้อมูลเพื่อทำลายสมมติฐานนี้ การทำมิเรอร์เป็นเทคโนโลยีการสำรองข้อมูลแบบดั้งเดิมที่สุด ซึ่งจะคัดลอกข้อมูลบนดิสก์ไดรฟ์บางกลุ่มไปยังดิสก์ไดรฟ์อีกกลุ่มหนึ่งโดยสมบูรณ์ เพื่อให้แน่ใจว่าจะมีสำเนาข้อมูลอยู่เสมอ เมื่อเปรียบเทียบกับค่าใช้จ่ายในการทำซ้ำ 50% ของการมิเรอร์ ความเท่าเทียมกันของข้อมูลจะมีน้อยกว่ามาก และใช้ข้อมูลความซ้ำซ้อนของความเท่าเทียมกันในการตรวจสอบและแก้ไขข้อมูล เทคโนโลยีการสำรองข้อมูลของ RAID ช่วยปรับปรุงความพร้อมใช้งานและความน่าเชื่อถือของข้อมูลได้อย่างมาก และช่วยให้มั่นใจได้ว่าเมื่อดิสก์หลายตัวล้มเหลว ข้อมูลจะไม่สูญหาย และการทำงานอย่างต่อเนื่องของระบบจะไม่ได้รับผลกระทบ

  • ความสามารถในการจัดการ: อันที่จริง RAID เป็นเทคโนโลยีการจำลองเสมือนที่สร้างดิสก์ไดรฟ์จริงหลายตัวให้เป็นไดรฟ์ลอจิคัลความจุขนาดใหญ่ สำหรับระบบโฮสต์ภายนอก RAID เป็นดิสก์ไดรฟ์ความจุขนาดใหญ่ตัวเดียวที่รวดเร็วและเชื่อถือได้ ด้วยวิธีนี้ผู้ใช้สามารถจัดระเบียบและจัดเก็บข้อมูลระบบแอปพลิเคชันบนไดรฟ์เสมือนนี้ได้ จากมุมมองของแอปพลิเคชันของผู้ใช้ สามารถทำให้ระบบจัดเก็บข้อมูลเรียบง่ายและใช้งานง่ายและจัดการได้ เนื่องจาก RAID ได้เสร็จสิ้นการจัดการพื้นที่จัดเก็บข้อมูลจำนวนมากภายในแล้ว ผู้ดูแลระบบจึงจำเป็นต้องจัดการไดรฟ์เสมือนเพียงไดรฟ์เดียวเท่านั้น ซึ่งสามารถบันทึกงานการจัดการได้จำนวนมาก RAID สามารถเพิ่มหรือลบดิสก์ไดรฟ์แบบไดนามิก และดำเนินการตรวจสอบข้อมูลและการสร้างข้อมูลใหม่โดยอัตโนมัติ ซึ่งช่วยให้งานการจัดการง่ายขึ้นอย่างมาก