Cùng với sự phát triển nhanh chóng của công nghệ, việc tạo ra lượng lớn dữ liệu đang trở thành một xu hướng toàn cầu. Một số chuyên gia thực hiện nghiên cứu về nhu cầu tạo và lưu trữ dữ liệu của bốn lĩnh vực khác nhau, bao gồm: thiên văn học, YouTube, Twitter và ngành gen DNA. Nhóm nghiên cứu phát hiện các phòng thí nghiệm thiên văn học lớn nhất, YoutTube và 20 phòng thí nghiệm DNA lớn nhất hiện cần khoảng 100 petabyte dung lượng lưu trữ bổ sung mỗi năm.
Ví dụ, dữ liệu gen của con người có thể đạt tới 40 exabyte và dự kiến sẽ tiếp tục tăng trong tương lai. Các kỹ thuật mới nhất đã giảm chi phí quét một bộ gen từ hơn 100.000 USD xuống chỉ còn dưới 1.000 USD. Điều này giúp việc quét hàng triệu, thậm chí hàng tỷ cá nhân trở nên khả thi và kinh tế hơn. Dữ liệu gen của mỗi người cần khoảng 200 GB dung lượng lưu trữ thô, vì vậy việc giải trình tự một triệu bộ gen người sẽ cần khoảng 200 petabyte.
Trong nhiều ngành, phân tích dữ liệu Big Data và các thuật toán dự đoán là vô cùng quan trọng để cung cấp thông tin chi tiết, giá trị. Tuy nhiên, với sự tăng trưởng nhanh chóng của dữ liệu, việc lưu trữ và quản lý Big Data trở thành một thách thức đối với hạ tầng IT.
Để tối ưu chi phí sở hữu (TCO) cho hệ thống lưu trữ dữ liệu Big Data, có một số giải pháp hiệu quả. Đầu tiên là sử dụng ổ cứng dung lượng cao.
So sánh giữa ba lựa chọn: một trung tâm lưu trữ sử dụng ổ cứng lần lượt với các dung lượng 16 TB, 18 TB và 22 TB. Để đạt dung lượng mong muốn, việc sử dụng ổ dung lượng cao sẽ cần ít hơn số lượng máy chủ và hệ thống lưu trữ, từ đó sẽ giảm các linh phụ kiện đi kèm cũng như hệ thống làm mát.
Một trung tâm lưu trữ càng tinh gọn càng tiết kiệm được chi phí đáng kể. OpEx (chi phí vận hành) giảm xuống từ việc giảm chi phí thuê phòng lắp đặt hoặc chi phí xây dựng. Chi phí hệ thống tản nhiệt và làm mát cũng giảm xuống, chi phí bảo trì cũng ít hơn. CapEx (chi phí đầu tư) tối ưu khi các thiết bị liên quan cũng ít hơn, bao gồm: máy chủ, thiết bị mạng cũng như là các tủ rack. Ngoài ra chi phí cho 1 TB dung lượng của ổ cứng dung lượng cao sẽ thấp hơn so với ổ cứng dung lượng thấp.
Thứ hai là giảm tần số rung trong hệ thống lưu trữ. Ổ cứng trở thành lựa chọn hàng đầu cho các hệ thống lưu trữ tập trung, đám mây hay big data vì chi phí và dung lượng lớn. Tuy nhiên, tần số rung động ảnh hưởng đến độ bền và hiệu suất của ổ cứng. Vì cơ chế vận hành dựa trên tốc độ vòng quay vật lý của các lớp đĩa bên trong, ổ cứng sẽ phát sinh tần số rung động. Điều này làm cho việc giữ các đầu đọc, ghi định vị dữ liệu chính xác trở nên khó khăn hơn.
Bên trong các hệ thống lưu trữ nhiều khay đĩa, ổ cứng sẽ chịu các rung động từ việc hoạt động hết công suất của chính nó, cộng với các rung động từ ổ cứng ở khay đĩa kế bên, rung động từ hệ thống quạt tản nhiệt… Tần số rung càng lớn, tỷ lệ hỏng của ổ cứng càng cao.
Western Digital đã phát triển công nghệ cách ly rung động IsoVibe, tích hợp trong các hệ thống lưu trữ Ultrastar JBOD 60 và 102 khay đĩa. Các ổ cứng được cách ly để tránh cộng hưởng rung động khi vận hành. Công nghệ giúp giảm tỷ lệ hư hỏng ổ cứng xuống 62% so với các hệ thống không tích hợp công nghệ này.
Cách thứ ba đến từ việc tối ưu hệ thống làm mát, tản nhiệt. Western Digital giải quyết vấn đề này bằng cách tích hợp công nghệ ArcticFlow vào hệ thống lưu trữ JBOD Ultrastar.
Ultrastar JBOD thiết kế đặc biệt với các rãnh nhỏ, giúp công nghệ ArcticFlow tập trung lượng khí lạnh di chuyển theo trục giữa thiết bị và các khe hở nhỏ giữa các khay ổ cứng xuyên suốt đến mặt sau của hệ thống. Điều này giúp tăng tuổi thọ của linh kiện và ổ cứng bên trong, đồng thời giảm chi phí tiêu thụ điện năng của hệ thống quạt. Theo ước tính, mỗi hệ thống Ultrastar JBOD tích hợp công nghệ ArcticFlow có thể tiết kiệm được khoảng 1.500 USD tiền điện mỗi năm.
Theo chuyên gia, giai đoạn thứ ba của cuộc cách mạng Big Data sẽ tập trung vào cơ sở hạ tầng. Để quản lý lượng dữ liệu khổng lồ được tạo ra và phân tích, chúng ta cần một mô hình phần cứng, phần mềm, mạng và trung tâm dữ liệu mới, thiết kế riêng cho mục đích này. Các trung tâm dữ liệu siêu quy mô đang dần hình thành, việc áp dụng những công nghệ và giải pháp mới trong các thiết bị lưu trữ sẽ giúp tiết kiệm chi phí, mang lại giá trị to lớn.
Minh Huy
Nguồn Bài Viết: https://vnexpress.net/giai-phap-toi-uu-chi-phi-ha-tang-luu-tru-cho-big-data-4622294.html