1. THÔNG BÁO TUYỂN ADMIN DIỄN ĐÀN 2013
    Tìm kiếm nhà trọ - Ở ghép
    THÔNG BÁO BÁN ÁO SPKT.NET CHO THÀNH VIÊN DIỄN ĐÀN


    HÃY TÌM KIẾM Ở ĐÂY TRƯỚC KHI ĐẶT CÂU HỎI
    {xen:phrase loading}

KIỂM SOÁT QUÁ TRÌNH LƯỢNG TỬ HOÁ TRONG NÉN VIDEO MPEG 2 (Phần I).

Thảo luận trong 'ĐT Cơ Bản-Mạch tương tự' bắt đầu bởi small ant, 28 Tháng sáu 2011.

  1. small ant Well-Known Member

    Số bài viết: 2,827
    Đã được thích: 88
    Điểm thành tích: 48
    Giới tính: Nữ
    1. Vài nét về các kỹ thuật nén video số hiện nay.

    Video số là chuỗi các ảnh số hoá liên tiếp nhau theo thời gian, mỗi ảnh số bao gồm nhiều dòng, nhiều phần tử ảnh (pixel); mỗi pixel được biểu diễn bởi ba màu cơ bản R, G, B. Tốc độ bit của video số khi chưa nén thường rất lớn (270 Mb/s đối với định dạng CCIR REC-601 4:2:2 cho truyền hình số tiêu chuẩn, hoặc 2 Gb/s đối với truyền hình có độ phân giải cao HDTV). Thực chất của kỹ thuật nén video số là loại bỏ đi các thông tin dư thừa, nhằm hướng đến các mục tiêu:

    • Giảm tốc độ dòng bit của tín hiệu gốc xuống một giá trị nhất định, đủ để có thể tái tạo ảnh khi giải nén;
    • Giảm dung lượng dữ liệu trong lưu trữ cũng như giảm băng thông truyền dẫn cần thiết;
    • Tiết kiệm chi phí trong lưu trữ và truyền dẫn dữ liệu trong khi vẫn duy trì chất lượng ảnh ở mức chấp nhận được.

    Các thông tin dư thừa trong nén video số thường là:

    • Độ dư thừa không gian giữa các pixel;
    • Độ dư thừa thời gian do các ảnh liên tiếp nhau;
    • Độ dư thừa do các thành phần màu biểu diễn từng pixel có độ tương quan cao;
    • Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bit với xác suất xuất hiện không đều nhau;
    • Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm nhận của hệ thống thị giác của con người).

    Để đạt tốc độ bit thấp hơn và trong các trường hợp có thể chấp nhận suy giảm chất lượng tín hiệu ở các mức độ khác nhau, người ta có thể loại bỏ một số thông tin ít quan trọng (xét dưới góc độ cảm nhận chủ quan của mắt người) như:

    • Giảm bớt các thành phần tần số không gian cao trong ảnh (giảm độ nét của ảnh);
    • Giảm bớt số lượng pixel trên ảnh (giảm bớt độ phân giải không gian ảnh, dẫn đến giảm kích thước ảnh);
    • Giảm bớt số ảnh trong 1 giây (giảm bớt độ phân giải thời gian ảnh, sẽ dẫn đến hình ảnh chuyển động bị giật, không trơn tru);
    • Giảm bớt độ phân giải màu dẫn đến màu sắc kém trung thực.

    Để đánh giá một kỹ thuật nén nào đó người ta thường so sánh số bit trung bình dùng để biểu diễn một ảnh với entropy được xác định như sau:
    [IMG]
    Trong đó:
    N – số phần tử ảnh
    P(xi) – xác xuất của từng phần tử ảnh
    Về thực chất, ENTROPY được hiểu như là số bit tối thiểu cần thiết để có thể tái tạo lại ảnh video. Kỹ thuật mã có hiệu quả nén càng cao khi số bit trung bình càng tiến gần về giá trị entropy.
    Mỗi giải pháp nén video khác nhau sẽ cho chất lượng ảnh, độ rộng băng thông kênh truyền video khác nhau. Dưới góc độ bảo tồn dữ liệu ảnh, kỹ thuật nén video được phân thành hai nhóm chính là nén không tổn hao và nén có tổn hao.

    1.1. Nén không tổn hao.

    Nén không tổn hao là quá trình chỉ loại bỏ bớt phần dữ liệu dư thừa. Với phương pháp này khi giải nén, tín hiệu được khôi phục lại nguyên vẹn như thông tin ban đầu, chính xác đến từng bit. Nén video số không tổn hao còn được gọi là mã hoá nguồn. Đây là quá trình biểu diễn các kí hiệu trong dòng bit nguồn thành dòng các từ mã, mỗi từ mã bao gồm một số bit nhất định sao cho giảm được tốc độ bit ở mức có thể. Các kỹ thuật thường dùng trong nén video số không tổn hao là:

    • Loại bỏ chổ trống: thông tin không quan trọng trong khoảng trống nằm ngang và thẳng đứng bị loại bỏ mà không ảnh huởng đến hình ảnh. Dòng bit ở đây được giảm xuống và chỉ chứa các khu vực ảnh quan trọng.
    • Biến đổi Cosine rời rạc DCT (Discrete Cosine Transforrm): là cơ sở của hầu hết các công nghệ nén ảnh (video) thương mại hiện nay. Kỹ thuật này chia các khối ảnh thành 64 phần tử ảnh (pixel) gồm 8 hàng và 8 cột, và biến đổi thành dãy 64 hệ số liên quan đến tần số (khả năng) xuất hiện của phần tử ảnh tương ứng. Các hệ số thấp tương ứng với tần số xuất hiện thấp (màu sắc hay độ sáng thay đổi chậm), và các hệ số cao cho các tần số xuất hiện cao (sự thay đổi nhanh của màu sắc hay độ sáng). Quá trình biến đổi thuận (mã hoá) và ngược (giải mã) là không tổn hao khi các hệ số tần số biến đổi có độ dài từ mã 13 đến 14 bít đối với một tín hiệu vào có mẫu từ 8 bit. Với 11 bit hay ít hơn quá trình DCT trở thành nén có tổn hao.
    • Mã hoá độ dài thay đổi VLC (Variable Length Coding): còn gọi là mã hoá Huffman hay mã hoá entropy. Kỹ thuật này quan tâm đến khả năng có thể xảy ra của các thông tin giống nhau trong một ảnh, gán các từ mã ngắn (số bit nhỏ) cho các giá trị có khả năng xuất hiện cao và các từ mã dài (số bit lớn) để mã hoá những giá trị ít khả năng xảy ra.
    • Mã hoá chiều dài chạy RLC (Run Length Coding): tạo ra các mã đặc biệt để đánh dấu sự bắt đầu và kết thúc của một chuỗi các giá trị lặp lại. Với kỹ thuật này chỉ có các giá trị khác 0 được mã hoá song song với các giá trị mẫu Zero suốt theo dòng quét.
    • Nén liên ảnh (Inter Frame Compression): tín hiệu video có đặc điểm là chứa các thông tin dư thừa trong miền thời gian. Trong một chuỗi liên tục các ảnh, lượng thông tin chứa đựng trong mỗi ảnh thay đổi rất ít từ ảnh này sang ảnh khác. Cơ sở kỹ thuật nén liên ảnh là tính toán sự dịch chuyển vị trí của nội
    dung (các khối) hình ảnh, từ đó xác định vectơ chuyển động của khối ảnh đó.

    Trong nén MPEG-2, trước hết kỹ thuật nén trong ảnh (Intra Frame Compression) được thực hiện một cách độc lập tại từng ảnh (frame) trong đoạn gồm các nhóm ảnh (GOP – group of pictures), cho kết quả là các ảnh I (intra-coded pictures). Sau đó các ảnh dự đoán trước P (Predicted Frame) sẽ được xác định trên cơ sở các thông tin về ảnh trước đó (được lưu trữ trong bộ nhớ với đầy đủ độ phân giải, đầy đủ dữ liệu) và các thông tin về vectơ chuyển động đã được xác định. Dữ liệu ảnh P có kích thước bằng 30 ÷ 50% ảnh I.
    Nén liên ảnh còn tạo ra các ảnh B (bidirectionally-coded Frame) được mã liên ảnh theo cả hai chiều. Đây là các ảnh được tạo ra nhờ sự tham chiếu cả hai ảnh đứng trước và đứng sau các ảnh I. Thông thường dữ liệu ảnh B có kích thước bằng 50% ảnh P. Đối với mỗi khối ảnh (khu vực) trong một ảnh dự báo, bộ mã hoá cố gắng tìm ra một khối tương tự trong ảnh tham chiếu. Nếu tìm được, bộ mã hoá sẽ mã hoá vectơ chuyển động để mô tả sự di chuyển theo phương thẳng đứng và nằm ngang (giữa các ảnh tham chiếu và ảnh dự báo) của khối đó, tính toán sự sai khác bất kỳ giữa khối nguồn và khối tham chiếu, mã hoá các dữ liệu sai khác nhờ sử dụng các công cụ và kỹ thuật giống như đã sử dụng đối với các khối trong ảnh (intra blocks). Nếu không tìm thấy khối tương tự, bộ mã hoá sẽ mã hoá khối này như một khối trong ảnh (intra block).

    1.2. Nén có tổn hao.

    Nén có tổn hao không chỉ loại bỏ đi các thông tin dư thừa, các thông tin không phù hợp với khả năng cảm nhận của mắt người, mà còn loại bỏ cả một phần thông tin ít quan trọng và chỉ tái tạo lại ảnh gần đúng với ảnh gốc. Đây là sự tổ hợp của các kỹ thuật giảm thông tin để đạt được một tỉ lệ nén cao (từ 3:1 đến 100:1) và là một quá trình không thuận nghịch. Hình ảnh sẽ bị giảm chất lượng sau khi giải nén do việc qui tròn (bỏ số dư) hay loại bỏ bớt dữ liệu trong một khung hình và giữa các khung hình. Các kỹ thuật đó là:

    • Lấy mẫu phụ (subsampling): là một biện pháp làm giảm dữ liệu rất hiệu quả, nhưng gây tổn thất cho độ phân giải ảnh, nên không áp dụng phương pháp này cho các tín hiệu chói. Thường chỉ áp dụng cho các tín hiệu màu với các sơ đồ lấy mẫu đã được chuẩn hoá (tuỳ theo từng ứng dụng cụ thể) như 4:2:2, 4:1:1 hay 4:2:0;
    • Điều chế mã xung vi sai DPCM (Differential Pulse Code Modulation): đây là mã hoá dự báo, truyền đi sự sai khác từ mẫu này đến mẫu khác thay cho việc truyền đi giá trị toàn bộ mẫu. Để loại bỏ sai số truyền, một giá trị mẫu đầy đủ sẽ được đi theo một chu kỳ nhất định;
    • Lượng tử hoá (Quantization): Lượng tử hoá là quá trình biểu diễn một tập các giá trị liên tục ở đầu vào bằng một lượng các giá trị giới hạn các kí hiệu ở đầu ra. Đây chính là khâu gây ra tổn hao khi ta loại bỏ những thông tin không phù hợp với khả năng cảm nhận của mắt người hay các thông tin không quan
    trọng. Phía giải nén có chức năng ngược lại - tạm gọi là quá trình Giải mã lượng tử (Requantization). Bên cạnh chức năng giảm số lượng bit, lượng tử hoá còn tạo khả năng kiểm soát tốc độ bit để tránh cho bộ nhớ đệm số (digital buffer) bị quá tải, duy trì một tốc độ bit không đổi cần thiết trong quá trình
    truyền phát sóng hay ghi (lưu trữ) video trên các băng đĩa hay ổ cứng máy tính, hoặc cho khả năng duy trì chất lượng ảnh được tái tạo không đổi trong suốt quá trình hiển thị video.

Chia sẻ trang này