Giới thiệu tổng quan về định dạng file DSF

monospace_DSF_cover.png

Định dạng file DSF định dạng file audio với dữ liệu nhạc DSD (1-bit audio) và lưu dữ những thông tin đi kèm. Đây là một định dạng nhạc đã gắn liền với khái niệm audiophile. Bây giờ chúng ta hãy cùng tìm hiểu về những chất lượng nhạc, khả năng chuyển đổi, các vần đề gặp phải khi phát nhạc, cấu trúc dữ liệu, etc…

DSD File bao gồm những gì

· Sample rates (tần số lấy mẫu) : 2.8 (D64), 5.6 (D128), 11.2 (D256), 22.5 (D512), 45.2 (D1024), ... MHz
· Bit-depth: 1 bit / 8 bit
· Cấu trúc để giải mã : sigma delta module (a.k.a. DSD)
· Channel number: 1 ... 6
· Metadata (song, album names, year, performer, artwork, etc.): ID3v2 format

Chi tiết hơn một chút thì

Sample rate DSD được tính bằng cách 44100 Hz x K (hệ số: 64=2^6, 128=2^7, 256=2^8, 512=2^9, 1024=2^10, etc)

Ví dụ: 44100 Hz * 64 = 2 822 400 Hz = 2.8 MHz

Ngoài ra DSD còn có thể được dựa trên tần số 4800 Hz (tuy nhiên dải này không được công nhận chính thức) Tuy nhiên các dải vẫn có thể được thu vào DSF tùy vào cách thu âm và mastering.

Cấu trúc của file audio DSF bao gồm:
1. Các giá trị trong header 
2. Dữ liệu nhạc
3. Khối thông tin Metadata

Các dữ liệu nhạc sẽ được chia thành từng khối. Khối cuối cùng có thể được viết một phần nhỏ. Việc ghi sai các dữ liệu trong header có thể dẫn đến việc đọc luôn phần trống trong khối cuối cùng của file. Trong trường hợp này có thể dẫn đến việc gây ra tiếng click trong cuối file DSF.

Số lượng channel được hỗ trợ phải là số nguyên, vì vậy nếu số channel vượt quá 6 thì vẫn có thể được hỗ trợ. DSF thường có số lượng loại channel cụ thể và vị trí của channel được sắp xếp từ "mono", "stereo" đến "5.1”. Tuy nhiên, các số lượng channel đặc biệt khác vẫn có thể được thu âm, tuy nhiên có thể gây lên vấn đề cho các thiết bị và phần mềm giải mã.

DSF file chất lượng nhạc (DSD vs. PCM)
monospace_DSF_trends2.jpg

Nếu chúng ta muốn so sánh chất lượng nhạc của

DSD (sigma delta modulation) vàand PCM (pulse code modulation), chúng tôi cũng đã thử bằng tai “trâu” của chúng tôi. So sánh giữa DSF và FLAC hoặc những chuẩnfile khác. Tuy nhiên mọi thứ lại không chỉ đơn giản như vậy

Đầu tiên các thông số kỹ thuật về thuật toán và các thiết bị đo đạc phần cứng cần phải được tách biệt rõ ràng.

File âm thanh có thể hiểu nôm na là cách áp dụng các phép toán vào trong mô hình lý thuyết trong chế độ điều biến sigma delta. Và tiêu chí cuối cùng đánh giá cuối cùng đó là quantization noise level (QNL: Độ nhiễu lượng tử). Mức độ nhiễu cũng sẽ phục thuộc vào tần số)

Các mạch điện tử sẽ là nhiễu đi tín hiệu số và các thuật toán bằng các thiết bị điện tử không tuyến tính, các tần số đáp ứng khác nhau, tiếng rền do các thiết bị điện, và khả năng bị nhiễu điện từ.

Các phần mềm phát nhạc cũng sẽ có những ảnh hưởng riêng như những phương pháp resample, các thuật toán tích hợp cũng như cắt ghép những mạch điều biến delta sigma khác nhau, có thể dẫn thêm những thay đổi trong chức năng cũng như chất âm


Bit depth (BD) và sample rate (SR)

DSD bit depth sẽ có thể mang bất kỳ giá trị là số nguyên dương nào theo lý thuyết. Bit depth và sample rate có thể được xem là tương đối phức tạp. Nhưng cả hai giá trị này đều sẽ có ảnh hưởng đến độ nhiễu lượng tử:

higher BD or SR => lower QNL.

Các nhạc có bit depth cao hơn sẽ có sai số lượng tử thấp hơn, và vì thế mức QNL thấp hơn

Mức sample rate cao hơn cho phép mức băng thông rộng hơn cho các tín hiệu âm thnah và các năng lượng do nhiễu sẽ được phân bổ trên một dải rộng hơn vì vậy mức QNL được giảm đi nhiều.

Độ nhiễu lượng tử QNL và sai số lượng tử QE là 2 điều khác nhau. QNL phụ thuộc vào QE. Tuy nhiên với cùng một mức QE, QNL có thể sẽ khác nhau tương đối nhiều ví dụ như đói với các tần số khác nhau.


Noise shaping (NS)
monospace_DSF_trends4.png
Để giảm năng lượng đến từ các sai số lượng tử tại các dải tầncó thể nghe thấy được,mạch điều biến sigma delta “đẩy mức năng lượng lên trên các dải tần số cao. Các dải tần còn lại sẽ được làm dự trữ để làm cho việc nắn nền và độ nhiễu.

Có các cách để làm tăng giải tín hiệu để truyền tải nhạc:

· tăng độ dốc trong việc điều chỉnh độ ồn của âm thanh
· Tăng giá trị tần số lấy mẫu

Tăng độ dốc trong Noise Shaping sẽ làm cho độ ổn định của mạch điều biến bị suy giảm đồng thời với khả năng bị quá tải

Tần số lấy mẫu cao hơn thì cũng sẽ làm tăng dung lượng file, tốn khả năng xử lý của máy tính và cách lấy mẫu cũng như mastering sẽ tốn thời gian.

Vậy liệu việc giảm bit depth có phải là giải pháp để đảm bảo chất lượng nhạc?

Các bạn có thể làm như vậy để kiểm soát mức nhiễu nền trong UMB, việc noise shaping cần được áp dụng. Năng lượng do sai số lượng tử hóa từ các dải tần số thấp sẽ được nắn lại và “đẩy lên” dải tần số cao. Tuy nhiên chúng ta sẽ bị mất đi một phần trong dải tần số cao trong toàn bộ các tần số đã được thu âm.

Noise Shaping có thể dẫn đến hiện tượng có artefacts (chi tiết giả) tại một vài điểm bởi vì Non-linear distortion ( bị nắn tần số không tuyến tính)

Quantization

Độ nhiễu lượng tử của file DSD sẽ phụ thuộc vào hệ thống giải mã sigma delta bao gồm mạch điều biến và mạch giải điều.

Thông thường DSD64 sẽ có độ nhiễu lớn hơn so với DSD 128, DSD 256, DSD 512. Bởi vì DSD64 có dải băng tần dự trữ ít hơn so với các tần số lấy mẫu cao hơn. Dải băng tần dự trữ thường được đặt ở tần số cao hơn, bởi vì trong dải tần số cao có thể đẩy các năng lượng do tiếng nhiễu nhanh hơn. Với tần số lấy mẫu thấp hơn- dải tần dự trữ ít hơn- những năng lượng nhiễu sẽ được đẩy ra ít hơn mà không ảnh hưởng đến sự hoạt động ổn định mạch điều biến Delta Sigma.

Trong phần sắp tới chúng ta sẽ chỉ quan tâm đến mức noise level trong các dải băng tần hữu ích trong các định dạng nhạc. Như bạn các bạn có thể thấy UMB mức độ ồn do noise-shaping tăng dần với mức độ ngày càng cao hơn.

Trên bảng dưới các bạn có thể nhìn thấy xu hướng sự rời rạc hóa của các tần số nhạc DSF càng tỷ lệ thuận tăng lên. Điều quan trọng các bạn cần lưu ý, rằng xu hướng trên phụ thuộc rất nhiều vào cách xử lý và lắp đặt mạch điều biến và giải biến.

monospace_DSF_trends.png

Kết luận

Từ góc nhìn của các mô hình toán học thì giữa DSD và PCM có những khác biệt giữa 2 phương diện:

· Độ nhiễu nền.

· Băng thông truyền tải tín hiệu.

Trong thực tế thì sẽ không có sự khác nhau giữa PCM và DSD, sự khác nhau giũa Pulse Code PCM( điều chế xung mã) và Delta Sigma Module (điều chế Sigma) chỉ nằm trên giấy tờ khi đơn giản chỉ là các format khác nhau. Bởi vì format chỉ là một mô hình lý thuyết toán học, vì thế sẽ chỉ khác nhau trong cách thu âm và cách lắp đặt mạch giải mã trong thực tế.

Những điểm khác nhau còn có thể do các phần mềm cũng như phần cứng của thiết bị,

Điều quan trọng nhất của nhà phát triển là nên tăng gì để làm giảm noise: Sample rate hay bit depth. (Ngoài ra còn có thể áp dụng kỹ thuật Noise Shaping)

Vì vậy sẽ không có một lợi ích cụ thể của PCM hay DSD theo kiểu là một định dạng format nhất định (định dạng chỉ là một mô hình toán học)

Tuy nhiên có thể sự khác biệt giữa 2 định dạng này sẽ do phần cứng của DAC hay các phần mềm đọc file DSF như Jriver, Roon, Foobar.. (bản thân mỗi phần mềm cũng có thuật toán giải mã khác nhau)

Note: DSF vs. DFF
Dữ liệu âm thanh đã được số hóa ( 1bit binary) có thể được sao chép trực tiếp từ file DSF vào file DFF.

Tuy nhiên DFF không có tiêu chuẩn nào để lưu trữ metadata.

DFF chứa nhiều nhiều block dữ liệu khác nhau. Nó cho phép các dữ liệu metadata vào các block, tuy nhiên các phần mềm đọc DFF sẽ dễ dàng nhận diện các block metadata.


  • Nguồn: monospace.vn