Mã hóa khối ảnh theo chuẩn nén video H.264 AVC - H.265 HEVC là gì

Mã hóa khối ảnh theo chuẩn nén video H.264 AVC - H.265 HEVC

Trong cuộc sống, trong từng ứng dụng cụ thể, trong truyền thông truyền hình… Dữ liệu và băng thông luôn luôn thiếu.

Trong truyền thông, viễn thông truyền hình Những định dạng mã hóa dữ liệu Video thường là những dữ liệu có dung lượng rất lớn, truyền hình có độ phân giải cao HDTV, nếu không nén thành các định dạng có dung lượng nhỏ thì tốc độ lên tới hơn 1,5 Gbps, với tốc độ như thế để truyền tải là rất khó khăn.

Do vậy các chuẩn nén video hay video / Audio Encoder ra đời nhằm loại bỏ những dữ liệu dư thừa mà vẫn đảm bảo chất lượng tốt

Chuẩn mã hóa (nén) H.264 – Encoder H.264 là một chuẩn tiên tiến ra đời chính thức vào năm 2003. Nó tạo ra sự đột phá, cho phép nén video một cách tốt hơn đồng thời cải thiện được chất lượng so với các chuẩn trước đó.

Vậy Công ty AVA sẽ tổng hợp và chia sẻ đến các bạn về Chuẩn mã hóa video H.264/AVC, h.264/mpeg-4 avc. h.264 dvr

Ứng dụng H.264 trong mô hình truyền hình internet IPTV

CÁC BỘ MÃ HÓA TIÊN TIẾN BẠN NÊN XEM

Phương pháp nén ảnh JPEG

1. Một số đặc điểm của dữ liệu ảnh

Một tính chất chung nhất của tất cả các ảnh số đó là tương quan giữa các pixel ở cạnh nhau lớn, điều này dẫn đến dư thừa thông tin để biểu diễn ảnh.

Dư thừa thông tin sẽ làm cho việc mã hoá không tối ưu. Do đó công việc cần làm để nén ảnh là phải tìm được các biểu diễn ảnh với tương quan nhỏ nhất để giảm thiểu độ dư thừa thông tin của ảnh.

Thực tế, có hai kiểu dư thừa thông tin được phân loại như sau:

- Dư thừa trong miền không gian: tương quan giữa các giá trị pixel của ảnh, điều này có nghĩa rằng các pixel lân cận của ảnh có giá trị gần giống nhau (trừ những pixel ở giáp đường biên ảnh).

- Dư thừa trong miền tần số: Tương quan giữa các mặt phẳng màu hoặc dải phổ khác nhau.

Trọng tâm của các nghiên cứu về nén ảnh là tìm cách giảm số bit cần để biểu diễn ảnh bằng việc loại bỏ dư thừa trong miền không gian và miền tần số càng nhiều càng tốt.

CÁC BỘ MÃ HÓA VIDEO H 264 AVC

Các kỹ thuật nén ảnh được sử dụng:

- Nén ảnh không mất thông tin : với phương pháp này sau khi giải nén ta khôi phục được chính xác ảnh gốc. Các phương pháp nén này bao gồm mã hoá Huffman, mã hoá thuật toán…

- Nén ảnh có mất thông tin: ảnh giải nén có một sự sai khác nhỏ so với ảnh gốc.

Các phương pháp này bao gồm:

Lượng tử hoá vô hướng: PCM và DPCM
Lượng tử hoá vector
Mã hoá biến đổi: biến đổi cosin rời rạc (DCT), biến đổi Fourier nhanh (FFT)
Mã hoá băng con

so-do-khi-he-thong-nen-anh

Nguyên lý nén ảnh JPEG

Nguyên lý của phương pháp nén JPEG là: Cắt hình ảnh thành từng khối nhỏ, phân tích tất cả các dữ liệu về màu sắc, độ sáng mà các khối đó chứa bằng các phương trình ma trận.

Ảnh màu trong không gian RGB (Red, Green, Blue) được chuyển đổi qua hệ YUV. Trong khi thị giác của con người lại rất nhạy cảm với hệ Y, ít nhạy cảm hơn nhiều với hệ U, V.

Hệ thống sẽ nén thành phần Y của ảnh ở mức độ ít hơn nhiều so với U và V. Kế tiếp là dùng biến đổi Cosin rời rạc, sau đó lượng hóa và mã hóa theo phương pháp Huffman. Khi giải nén ảnh, các bước thực thi sẽ làm ngược lại quá trình nói trên.

Các bước trong nén ảnh JPEG

Mã hoá biến đổi DCT

Nguyên tắc chính của phương pháp mã hoá này là biến đổi tập các giá trị pixel của ảnh trong miền không gian sang một tập các giá trị khác trong miền tần số sao cho các hệ số trong tập giá trị mới này có tương quan giữa các điểm ảnh gần nhau nhỏ hơn.

ma-hoa-giai-ma-dung-bien-doi-dct

BIẾN ĐỔI DCT THUẬN VÀ NGHỊCH

Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnh được phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x 8 pixel và biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dương có giá trị từ 0 đến 255.

Việc phân khối này sẽ làm giảm được một phần thời gian tính toán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độ chính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra.

Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biến đổi. 2 công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối với mỗi khối ảnh có kích thước 8 x 8. Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trong miền không gian, X(k1, k2) là các hệ số sau biến đổi DCT trong miền tần số

cong-thuc-ma-hoa-giai-ma-dung-bien-doi-dct

Mỗi khối 64 điểm ảnh sau biến đổi DCT thuận sẽ nhận được 64 hệ số thực DCT (bảng 1). Mỗi hệ số này có chứa một trong 64 thành phần tần số không gian hai chiều. Hệ số với tần số bằng không theo cả hai hướng (tương ứng với k1 và k2 bằng 0) được gọi là hệ số một chiều DC, hệ số này chính là giá trị trung bình của 64 điểm ảnh trong khối. 63 hệ số còn lại gọi là các hệ số xoay chiều AC. Hệ số một chiều DC tập trung phần lớn năng lượng của ảnh.

so-do-ma-hoa-giai-ma-dung-bien-doi-dct

Bảng 1. Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối

Chú ý rằng bản thân biến đổi DCT không làm mất thông tin vì DCT là một biến đổi tuyến tính chuyển các giá trị của điểm ảnh từ miền không gian thành các hệ số trong miền tần số.

Nếu biến đổi DCT thuận và nghịch được tính toán với độ chính xác tuyệt đối và nếu các hệ số DCT không phải qua bước lượng tử và mã hoá thì ảnh thu được sau biến đổi DCT ngược sẽ giống hệt ảnh gốc.

Lượng tử và giải lượng tử

Sau khi thực hiện biến đối DCT, 64 hệ số sẽ được lượng tử hoá dựa trên một bảng lượng tử gồm 64 phần tử Q(u,v) với 0≤u, v≤7.

Bảng này được định nghĩa bởi từng ứng dụng cụ thể. Các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 được gọi là các bước nhảy cho các hệ số DCT. Quá trình lượng tử được coi như là việc chia các hệ số DCT cho bước nhảy lượng tử tương ứng, kết quả này sau đó sẽ được làm tròn xuống số nguyên gần nhất.

Công thức (3) thể hiện việc lượng tử với F(u,v) là các hệ số DCT, FQ(u,v) là các hệ số sau lượng tử, các hệ số này sẽ được đưa vào bộ mã hoá Entropy

luong-tu-va-giai-luong-tu

Mục đích của việc lượng tử hoá là giảm số lượng bit cần để lưu trữ các hệ số biến đổi bằng việc giảm độ chính xác của các hệ số này cho nên lượng tử là quá trình xử lý có mất thông tin.

Quá trình giải lượng tử ở phía bộ giải mã được thực hiên ngược lại. Các hệ số sau bộ giải mã entropy sẽ nhân với các bước nhảy trong bảng lượng tử (bảng lượng tử được đặt trong phần header của ảnh JPEG). Kết quả này sau đó sẽ được đưa vào biến đổi DCT ngược.

Chuẩn nén MPEG

Khái quát

- MPEG (Moving Picture Expert Group) là nhóm chuyên gia về hìnhảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây dựng tiêu chuẩn cho tín hiệu Audio và Video số.

Ngày nay, MPEGđã trở thành một kỹ thuật nén Audio và Video phổ biến nhất vì nó không chỉ là một tiêu chuẩn riêng biệt mà tuỳ thuộc vào yêu cầu cụ thể của từng thiết bị sẽ có một tiêu chuẩn thích hợp nhưng vẫn trên cùng một nguyên lý thống nhất.

- Tiêu chuẩn đầu tiên được nhóm MPEG đưa ra là MPEG-1, mục tiêu của MPEG-1 là mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s và lưu trữ trong đĩa CD với chất lượng tương đương VHS.

- Tiêu chuẩn thứ 2 : MPEG-2 được rađời vào năm 1990, không như MPEG-1 chỉ nhằm lưu trữ hình ảnh động vào đĩa với dung lượng bit thấp. MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát triển. Các công cụ đó gọi là “Profiles” được tiêu chuẩn hoá và có thể sử dụng để phục vụ nhiều mục đích khác nhau.

- Tiêu chuẩn tiếp theo mà MPEG đưa ra là MPEG-4, được đưa ra vào tháng 10 năm 1998,đã tạo ra một phương thức thiết lập và tương tác mới với truyền thông nghe nhìn trên mạng Internet, tạo ra một phương thức sản xuất, cung cấp và tiêu thụ mới các nội dung video trên cơ sơ nội dung và hướng đối tượng (Content/object-based)

cau-truc-bit-MPEG-video

H264 là chuẩn công nghiệp trong nén video – một quá trình biến đổi dữ liệu video số về 1 định dạng chiếm ít dung lượng hơn để lưu trữ hoặc truyền đi. H264 được công bố đầu tiên năm 2003, xây dựng dựa trên các chuẩn trước đó như MPEG2, MPEG4 với mục đích tăng hiệu quả nén, tăng tính mềm dẻo trong nén video, truyền video và lưu trữ video

chuan-nen-h264-haot-dong-ra-sao

H264 hoạt động như thế nào?

Việc nén H264 được thực hiện qua các quá trình: Prediction, transform, Encode để có được dòng bit H264 (bit stream). Bộ giải mã H264 thực hiện quá trình ngược lại: decoding, inverse transform, reconstruction.

- Quá trình mã hóa:

Prediction

Bộ mã hóa xử lý một khung video (frame) dưới dạng các khối (macroblock) 16x16 pixel. Nó xây dựng 1 bộ dự đoán khối dựa trên các dữ liệu mã hóa trước đó, các dữ liệu này có thể ở frame hiện tại (intra prediction) hoặc ở các frame đã được mã hóa và truyền đi trước đó (inter prediction). Bộ giải mã sẽ lấy khối hiện tại trừ đi khối dự đoán của nó để thu được 1 phần dư.

Phương pháp dự đoán của H264 mềm dẻo hơn các phương pháp dự đoán của các chuẩn trước đó, cho phép các dự đoán chính xác và tăng cường hiệu quả nén video. Dự đoán trong (intra prediction) dùng khối 16x16 và 4x4 để dự đoán khối từ các khối xung quanh đã được xử lý trước đó trong cùng frame. (Như minh họa trong hình dưới đây)

ma-hoa-h264

Dự đoán liên khung (inter prediction) sử dụng khối có kích thước từ 4x4 đến 16x16 để dự đoán các điểm ảnh trong khung hiện tại từ các miền tương ứng trong các khung đã được xử lý trước đó. (Minh họa ở hình dưới)

ma-hoa-h264-codec

Biến đổi và lượng hóa

Dùng phép biến đổi nguyên 4x4 hoặc 8x8 để biến đổi phần chênh lệch của khối (block) thực và khối dự đoán của nó. Phép biến đổi này là phép biến đổi cosin rời rạc. Sau biến đổi ta thu được 1 tập các hệ số, mỗi hệ số là trọng số ứng với 1 mẫu cơ bản ( khi ta kết hợp các mẫu cơ bản này lại – dùng các trọng số vừa tính được , thì sẽ tái tạo lại được phần dư vừa biến đổi ) Hình sau mô tả quá trình biến đổi cosin rời rạc ngược.

Luong-hoa-jpeg

Mã hóa dòng bit

Quá trình nén video đưa ra một số giá trị phải đưa vào mã hóa để xây dựng dòng bit đã nén. Các giá trị đó gồm:

+ Các hệ số đã lượng hóa

+ Thông tin cho phép bộ giải mã có thể tái tạo quá trình dự đoán.

+ Thông tin về cấu trúc của dữ liệu đã nén và công cụ dùng trong quá trình mã hóa.

+ Thông tin về thứ tự đầy đủ của các frame.

Các giá trị và tham số này (gọi là các thành phần cú pháp H264) được chuyển thành dữ liệu nhị phân và dùng phương pháp nén “variable length coding” và /hoặc “arithmetic coding”. Dòng bit nén này có thể được lưu trữ lại hoặc truyền đi.

- Quá trình giải mã

Giải mã dòng bit

Giải lượng hóa và biến đổi ngược

Tái tạo các frame.

H264 trong thực tế

• Hiệu quả

So với các chuẩn nén MPEG2 , MPEG4-visual thì H264 có thể mang lại chất lượng video cao hơn với cùng 1 tỉ lệ nén. (Hoặc nén tốt hơn với cùng chất lượng video)

khac-biet-h264-h265

• Ứng dụng

Do có được ưu điểm vượt trội trong hiệu quả nén video nên H264 được ứng dụng rất rộng rãi.

- DVD độ nét cao (High definition DVD)

- High definition TV broadcasting ở Châu Âu.

- Các sản phẩm của Apple (iTune , iPod…)

- Mobile TV broadcasting

- Internet video

- Video conferencing

FFMPEG

Tuy nhiên hiện nay chuẩn Video tiên tiến hơn đã xuất hiện cùng với suwpj phá triển của công nghệ:

Chuẩn nén định dạng H.265 HEVC- H.265 HEVC Encoder

XEM THÊM BỘ MÃ HÓA H264 VÀ H265

Chuẩn High Efficiency Video Coding (HEVC) cung cấp chất lượng nén video được cải thiện đáng kể so với những người tiền nhiệm của nó (gần đây nhất là H.264/AVC). Tiêu chuẩn này đã được phê chuẩn vào năm 2013 với H.265 của ITU-T và MPEG-H Part 2 của ISO/IEC.

bang-thong-h264-h265

bang-thong-h264-h265

Vậy so sánh chuẩn nén video H 264 và H265

Bài kiểm tra cho kết quả các tính toán dựa PSNR cho thấy tổng lượng dữ liệu ghi lại trong mỗi giây (bit rate) trong HEVC (High Efficiency Video Coding: chuẩn nén video chất lượng cao) cao hơn 50% so với chuẩn H.264/AVC nhưng cho chất lượng video tương tự.

Các thử nghiệm sử dụng một tập hợp của chuỗi video được mã hóa với 4 cỡ phân giải hình ảnh khác nhau: UHD (3840x2160 pixel và 4096x2048 pixel), 1080p (1920x1080 pixel), 720p (1280x720 pixel) vàd 480p (832x480 pixel) với tần số quét là 30Hz, 50Hz, hoặc 60Hz.

Nội dung video đã được lựa chọn để đại diện cho đặc trưng không gian và thời gian khác nhau, và sau đó được mã hóa bằng cách sử dụng các tiêu chuẩn HEVC và AVC để cho ra các video và so sánh chất lượng với nhau.

do-phan-giai-h264-h265

>>> BẠN NÊN XEM THÊM CÁC BỘ MÃ HÓA TRUYỀN HÌNH ENCODER >>>>

BỘ mã hoá 3 HDMI ra IP SPTS Terra mhi430

Bộ mã hoá Terra mhi430 chuyển đổi 3 HDMI ra IP SPTS cho IPTV Đây là bộ mã hoá của Terra có chức năng chuyển đổi (bộ mã hoá) từ 3 ngõ vào HDMI ra IP. Dùng cho IPTV, với IP ra chuẩn giao thức UDP/RTP, multicast, SPTS. Terramhi430 HDMI x 3 ports to DVB-IP encoder IP...

Bộ mã hoá tín hiệu 4 ngõ HDMI ra IPTV của Lemco

Lemco MLH-201 là Bộ mã hoá tín hiệu 4 ngõ HDMI ra IP cho hệ thống truyền hình IPTV, cho giải pháp IPTV cho khách sạn, IPTV hotel. Hỗ trợ SPTS và MPTS MLH-201 là một thiết bị headend mini rất mạnh mẽ, All in one, có thể nhận và mã hoá 4...

AVA3552HV bộ mã hóa tín hiệu HDMI HD-SDI ra IP cho IPTV

AVA3552HV bộ mã hóa tín hiệu HDMI HD-SDI ra IP cho IPTV AVA3552HV bộ mã hóa tín hiệu 4 HDMI, 8 HDMI, 12 HDMI hoặc HD-SDI mã hóa tín hiệu MPEG 4 AVC H.264, HEVC H.265 ra IP giao thức UDP, RTP, RTSP dạng SPTS, MPTS cho IPTV Bộ mã hóa tín hiệu có các model...

Bộ mã hoá chuyên nghiệp Harmonic CP3100

Bộ mã hoá chuyên nghiệp Harmonic CP3100 Bộ mã hoá điều chế Harmonic DS ViBE CP3000 là series bao gồm các model CP3100, CP3102, CP3200, CP3202 cho hệ thống truyền hình, điện thoại, flyaway, hỗ trợ C band, Ku band, Ka Band ViBE CP300 là series điều chế mã hoá chuyên...

Bộ mã hóa tín hiệu truyền hình cáp, số 12HDMI H.265 HEVC Encoder

Bộ mã hóa tín hiệu truyền hình cáp, số 12HDMI H.265 HEVC hoặc H.264 AVC Sơ lược sản phẩm DHP200 là bộ mã hóa H.265 / HEVC định dạng MPEG-1 thế hệ mới được phát triển nghiên cứu và sản xuất vào 2018 dựa trên tổng quan nền tảng tiên...

Thiết bị mã hóa tín hiệu truyền hình số NDS3544KF mã hóa đa kênh

Bộ mã hóa tín hiệu truyền hình số đa kênh NDS3544KF NDS3544KF Multi-Channel Encoder Là thiết bị mã hóa, ghép kênh âm thanh và video mới với chức năng mạnh mẽ. Bộ mã hóa tín hiệu truyền hình số này hỗ trợ 24 cổng...

Bộ mã hoá tín hiệu HD SD SDI HDMI ra IP 3224H

Bộ mã hoá tín hiệu HD SD SDI HDMI ra IP 3224H Encoder Bộ mã hoá tín hiệu HD SD SDI HDMI ra IP 3224H Encoder hỗ trợ 4, 8, 12 cổng HDMI, SDI tuỳ chọn ra IP out là 1 MPTS và 4 SPTS, Unicast, Multicast Tính năng bộ mã hoá encoder Enhance Picture Quality: Advanced Compressing...

Bộ mã hoá Winersat WPG-400H

Bộ mã hoá Winersat WPG-400H Encoder - 4 cổng HDMI, 2 ASI, ra IP Bộ mã hoá Winersat WPG-400H, Encoder của Winersat với 4 cổng HDMI vào, 2 cổng ASI vào dùng trong truyền hình IPTV, truyền hình Internet cho khách sạn, TH ra IP và ASI Xem thêm các bộ mã hoá...

Bộ mã hóa mạng 3558A - Mã hóa tín hiệu số HDMI, A/V ra IP

Mã hóa tín hiệu số HDMI, A/V ra IP 3358A Bộ mã hóa tín hiệu số mạng 3558A dùng trong truyền hình.để mã hóa tín hiệu số HDMI, A/V, STB, PC, tivi, USB ra tín hiệu số IP giao thức UDP, RTP, RTSP, HTTP, HLS Nguồn tín hiệu RF từ HDMI, A/V có thể từ STB,...

Bộ mã hoá IPTV từ 4 ngõ HDMI, Dùng trong truyền hình IPTV

Bộ mã hoá IPTV từ 4 ngõ HDMI, Dùng trong truyền hình IPTV Bộ mã hoá IPTV từ 4 ngõ HDMI, Dùng trong truyền hình IPTV, HDMI Encoder, SDI Encoder, H.264 Encoder, Video Encoder, Encoder IPTV, HDMI Encoder H.264 Xem thêm các bộ mã hoá cho truyền hình IPTV...

Bộ mã hoá tín hiệu 8 cổng HDMI ra IP

Bộ mã hoá tín hiệu 8 cổng HDMI ra IP - Mã hoá MPEG-4 /H.264 AVC Bộ mã hoá tín hiệu 8 cổng HDMI ra tín hiệu IP dùng trong hệ thống truyền hình IPTV cho khách sạn, chuẩn mã hoá MPEG-4 /H.264 AVC, IP ra từ HDMI theo UDP, RTP XEM THÊM CÁC BỘ...

Bộ mã hoá IPTV, 3U Rack 16 kênh, Mã hoá HDMI sang IP, cho IPTV

Bộ mã hoá IPTV, thiết kế 3U mã hoá 16 kênh cho hệ thống IPTV, Chức năng mã hoá tín hiệu Video từ HDMI sang IP cho Streaming, cho IPTV khách sạn, resort Có thể bạn quan tâm đến các bộ mã hoá HDMI cho IPTV khác Bộ mã hóa video...