Chuẩn nén hình H.265+ là gì?

Khi nói đến việc lắp đặt camera giám sát hiện nay không thể không nhắc tới chuẩn nén hình H.265+ vì dung lượng lưu trữ quá nhỏ, số tiền bỏ ra mua ổ cứng hoặc thẻ nhớ ít hơn. Vậy chuẩn nén hình H.265+ là gì?

Chuẩn nén hình H.265+ là gì?

1. Công nghệ Chuẩn nén hình H.265+ là gì?

Vài năm trước, camera giám sát siêu HD đã được phát triển. Tuy nhiên, cho đến nay nó vẫn chưa được áp dụng rộng rãi vì nó đòi hỏi băng thông truyền rộng và dung lượng lưu trữ lớn. Do đó, làm thế nào để hạn chế tốc độ bit của luồng video siêu HD trở thành một vấn đề nghiêm trọng quyết định mức độ phổ biến của camera siêu HD.

Công nghệ H. 265+ là một thuật toán thông minh được phát triển bởi Hikvision. Đây là một công nghệ mã hóa đáng chú ý dựa trên tiêu chuẩn H. 265 / HEVC (Mã hóa video hiệu quả cao) và được tối ưu hóa để giảm dung lượng lưu trữ, tiết kiệm chi phí trong camera giám sát độ nét cao.

2. Các đặc điểm nổi bật

Chuẩn nén hình H.265+ giúp cải thiện tỷ lệ nén dựa trên ba công nghệ chính: công nghệ mã hóa dự đoán dựa trên mô hình nền, công nghệ khử nhiễu nền và công nghệ kiểm soát bitrate dài hạn.

2.1 Công nghệ mã hóa dự đoán

Ở các thuật toán nén chính hiện tại như MPEG2, MPEG4, H.264 / AVC và H.265 / HEVC hiện đều dựa trên khung của mã hóa lai. Còn ở H.265+ thì thuật toán mã hóa dự đoán là một trong những công nghệ cốt lõi ảnh hưởng đến hiệu suất nén. Nó có thể được chia thành mã hóa dự đoán giữa khung và dự đoán trong khung.

  • Dự đoán giữa các khung tạo ra một mô hình dự đoán từ một hoặc nhiều khung hoặc trường video được mã hóa trước đó bằng cách sử dụng bù chuyển động dựa trên khối.
  • Dự đoán trong khung có nghĩa là các mẫu của macroblock (đơn vị xử lý) được dự đoán bằng cách chỉ sử dụng thông tin của các macroblocks đã truyền của cùng một khung.

Đối với các khung khác nhau trong luồng video, các phương thức mã hóa khác nhau được áp dụng. I-frame có thể được mã hóa riêng và nó áp dụng công nghệ mã hóa dự đoán trong khung. Mã hóa P-frame dựa trên mã hóa khung I hoặc khung P và nó chấp nhận mã hóa dự đoán giữa khung. Vậy mã hóa I-frame và P-frame là gì?

2.1.1 Mã khóa P-frame

P-frame, bạn có thể hạ thấp tốc độ bit bằng cách chỉ nén chênh lệch giữa khung hiện tại và khung tham chiếu. Do đó, chọn khung tham chiếu phù hợp là chìa khóa để cải thiện tỷ lệ nén luồng.

Đối với một video giám sát, những hình ảnh chủ yếu là không có chuyển động nhiều. Vì vậy, chúng ta có thể trích xuất một khung nền làm khung tham chiếu để mã hóa. Khung nền nên chứa càng ít đối tượng chuyển động càng tốt.

Hãy xem 3 hình ảnh bên dưới, ảnh T0 và T1 là các hình ảnh được mã hóa. Bạn có thể lấy khung nền làm khung tham chiếu, sau đó mã hóa ở ảnh T2 dựa trên sự tương đồng và khác biệt giữa ảnh T1 (khung tham chiếu) và ảnh T0 (khung nền). Vì T0 chứa ít đối tượng chuyển động hơn, nên nó là một lựa chọn tốt làm khung nền.

Chọn khung nền tốt nhất

Hình 1 - Chọn khung nền tốt nhất

Chúng ta có thể trích xuất đối tượng chuyển động từ ảnh T1 và T2, như trong Hình 2. Đối tượng di chuyển B sang A, khi mã hóa khung T2, khu vực B là khu vực mới tiếp xúc.

 Đối tượng di chuyển từ B đến A

Hình 2 - Đối tượng di chuyển từ B sang A

Ví dụ 1: Nếu chúng ta chỉ lấy ảnh T1 làm khung tham chiếu, nó sẽ tốn nhiều bit hơn khi mã hóa vùng B vì chúng ta không thể tìm thấy một khu vực trong ảnh T1 tương tự như khu vực B.

Loại tham chiếu thông thường

Hình 2 - Loại tham chiếu thông thường

Ví dụ 2: Tuy nhiên, nếu chúng ta chỉ lấy khung nền (T0) làm khung tham chiếu, chúng ta có thể tìm thấy một khối gần giống với khu vực B, trong khi khu vực A là khu vực mới. Sau đó, nó sẽ tốn nhiều bit hơn khi mã hóa vùng A.

Ví dụ 3: Nếu chúng ta lấy khung nền và T1 làm khung tham chiếu, chúng ta có thể chỉ cần tìm các khu vực tương tự với khu vực A và khu vực B. Sau đó, số bit có thể được giảm đến giá trị thấp nhất.

Loại tham chiếu nền

Hình 4 - Loại tham chiếu nền

2.1.1 Mã khóa P-frame và I-frame

I-frame bật lên cứ sau vài giây khi mã hóa video giám sát. Do đó, bitrate khung hình I chiếm tỷ lệ khá cao trong quá trình mã hóa, đặc biệt đối với môi trường tương đối bất động. Trong một số trường hợp, I-frame có thể chiếm tới năm mươi phần trăm tài nguyên mã hóa. Hơn nữa, thông tin được hiển thị bởi I-frame là lặp đi lặp lại khi nền ổn định.

Để giảm bitrate của khung I lặp đi lặp lại, H.265 + thiết kế mối quan hệ tham chiếu mã hóa dự đoán (dựa trên mô hình nền) được hiển thị như Hình 5.

Dự đoán mối quan hệ mã hóa tham chiếu

Hình 5 - Dự đoán mối quan hệ mã hóa tham chiếu

 Kiểu Frame Khoảng thời gian Mô tả
 I-frame (Background frame) 8s - 12s I-frame được mã hóa hoàn toàn dựa trên hình ảnh hiện tại thông qua mã hóa dự đoán trong khung hình. Nó có một khung hình được thuật toán thông minh chọn và chứa càng ít đối tượng chuyển động càng tốt.
 R (Refesh) - Frame 2s Khung R áp dụng mã hóa dự đoán trong khung hình (đối với các đối tượng chuyển động) và mã hóa dự đoán giữa khung hình dựa trên khung I (đối với các đối tượng bất động). Khung R hoạt động như khung hình I trong luồng video trong quá trình truy cập ngẫu nhiên để đảm bảo trải nghiệm người dùng phát lại.
 P-frame Giống tỷ lệ khung hình Khung hình thông qua mã hóa dự đoán giữa các khung dựa trên khung trước đó (khung P hoặc khung R) và I-frame.

Với khung R, bitrate có thể được giảm xuống với trải nghiệm người dùng phát lại cũng được đảm bảo. Xem hình bên dưới để biết quy trình mã hóa khung R. Các đối tượng chuyển động, được đánh dấu bằng các hình chữ nhật màu đỏ được mã hóa bằng mã hóa dự đoán trong khung và có chất lượng tốt. Nền thông qua mã hóa dự đoán giữa các khung.

Mã hóa dự đoán hỗn hợp R-Frame

Hình 6 - Mã hóa dự đoán hỗn hợp R-Frame

2.2 Công nghệ khử nhiễu nền

Thông thường, để đảm bảo chất lượng của các đối tượng chuyển động, mô-đun mã hóa cũng mã hóa ảnh nhiễu trong môi trường. Nhưng giờ đây, với thuật toán phân tích thông minh có thể phân biệt giữa hình nền và các đối tượng chuyển động, các đối tượng chuyển động và nền có thể được mã hóa bằng các chiến lược mã hóa khác nhau.

Như được hiển thị trong Hình 7, thuật toán phân tích thông minh trích xuất hình nền và phương tiện di chuyển. Hình nền được mã hóa với độ nén cao để triệt nhiễu và giảm tốc độ bit.

Công nghệ khử nhiễu nền

Hình 7 - Công nghệ khử nhiễu nền

2.3 Công nghệ kiểm soát Bitrate dài hạn

Hikvision giới thiệu một loại khái niệm bitrate mới có tên là "Tốc độ bit trung bình dài hạn" để sử dụng toàn bộ bitrate. Tốc độ bit trung bình dài hạn có nghĩa là tốc độ bit trung bình trong các khoảng thời gian khác nhau (thường là 24 giờ). Với điều khiển bitrate trung bình, camera có thể chỉ định tốc độ bit nhiều hơn cho những đoạn video có nhiều chuyển động trong khi giảm tốc độ bit trong lúc không có chuyển động (chẳng hạn như thời gian từ 0:00 đến 9:00 và 20:00 đến 24:00),như được hiển thị trong sơ đồ dưới đây (chúng tôi lấy điều khiển bitrate không đổi làm ví dụ)

Kiểm soát birate

Hình 8 - Kiểm soát birate

  •  Kiểm soát Bitrate liên tục

Đối với mã hóa H.265 với bitrate được định cấu hình là hằng số, bitrate hơi thay đổi gần Max được xác định trước. giá trị bitrate. Với H.265 +, tốc độ bit trung bình có thể được giữ dưới dạng một nửa giá trị của Max. bitrate và chất lượng hình ảnh có thể được tối ưu hóa do công nghệ H.265 + sử dụng toàn bộ từng bit.

  • Điều khiển bitrate thay đổi

Trong chế độ bitrate biến đổi, tốc độ bit tức thời thay đổi tùy theo độ bận của cảnh, trong khi chất lượng hình ảnh ổn định. Khi H.265 + được bật, thay đổi bitrate có thể được chia thành hai trường hợp.

- Nếu giá trị bitrate trung bình được đặt bị giới hạn, mã hóa H.265 + có thể cung cấp chất lượng hình ảnh tốt hơn với tốc độ bit bị giới hạn.

- Nếu giá trị bitrate trung bình đã đặt cao cho hình ảnh giám sát, tốc độ bit trung bình thực tế có thể thấp hơn giá trị được xác định trước, do đó lưu trữ có thể được lưu.

3. Kiểm tra Bitrate

Thử nghiệm giảm bitrate dựa trên các camera full HD1080p @ 25fps. Kết quả có thể được chia thành hai phần: so sánh bitrate tức thời trong các trường hợp khác nhau và kích thước tệp trong 24 giờ dẫn đến các tiêu chuẩn mã hóa khác nhau.

3.1 So sánh bitrate tức thời trong các trường hợp khác nhau


 STT
  Mô tả hoạt cảnh Bitrate (kbps) Tỷ lệ giảm
 
H.264H.265+
1Cafe, Chiếu sáng đầy đủ, Nhiều đối tượng chuyển động3.48165081.3%
2Cafe, Chiếu sáng đầy đủ, Một vài đối tượng chuyển động2.25334084.9%
3Cafe, Chiếu sáng thấp (IR On),Bất động93010888.4%
4Đường phố, chiếu sáng đầy đủ, nhiều đối tượng chuyển động4.40397078.0%
5Đường phố, chiếu sáng đầy đủ, một vài vật thể chuyển động4.09651887.4%
6 Đường phố, chiếu sáng thấp, bất động2.66248082.0%
Tỷ lệ giảm trung bình83.7%

Bảng 1 - So sánh bitrate tức thì giữa H.264 và Hikvision H.265 +


 STT
  Mô tả hoạt cảnh Bitrate (kbps) Tỷ lệ giảm
 
H.264H.265+
1Cafe, Chiếu sáng đầy đủ, Nhiều đối tượng chuyển động1.84365063.9%
2Cafe, Chiếu sáng đầy đủ, Một vài đối tượng chuyển động1.28934071.7%
3Cafe, Chiếu sáng thấp (IR On),Bất động45310876.2%
4Đường phố, chiếu sáng đầy đủ, nhiều đối tượng chuyển động2.15497053.8%
5Đường phố, chiếu sáng đầy đủ, một vài vật thể chuyển động1.33151860.2%
6 Đường phố, chiếu sáng thấp, bất động1.94648074.7%
Tỷ lệ giảm trung bình66.8%

Bảng 2 - So sánh bitrate tức thì giữa H.265 và Hikvision H.265 +

Kết luận:

1. Tỷ lệ giảm trung bình giữa H.264 và Hikvision H.265 + là 83,7% và tỷ lệ giữa H.265 và Hikvision H.265 + là 66,8%. Hikvision H.265 + có thể làm giảm đáng kể bitrate trong cùng một cảnh video.

2. Tốc độ bitrate giảm khi số lượng vật thể chuyển động trong cảnh tăng lên.

3.1 Kích thước tệp trong 24 giờ của các cảnh video khác nhau

Ví dụ 1: Quán cafe

Thời gian  Tốc độ Bitrate trung bình (kbps)
H.264H.265H.265+
09: 00-21: 00 (Ban ngày)3.4821.843650
21:00 - 09:00 sáng hôm sau (Đêm)930452108
Kích thước tệp trung bình trong 24 giờ (GB)22.711.83.9

Bảng 3 - So sánh kích thước tệp trong 24 giờ ở quán Café

Biểu đồ so sánh

Hình 9 - Biểu đồ so sánh

Ví dụ 2: Ngã tư đường giao thông

Thời gian  Tốc độ Bitrate trung bình (kbps)
H.264H.265H.265+
09: 00-21: 00 (Ban ngày)4.4032.150970
21:00 - 09:00 sáng hôm sau (Đêm)2.6621.945480
Kích thước tệp trung bình trong 24 giờ (GB)36.421.17.5

Bảng 3 - So sánh kích thước tệp trong 24 giờ ở ngã tư đường giao thông

Biểu đồ so sánh

Hình 10 - Biểu đồ so sánh

Kết luận:

  • Đối với camera agiám sát ở quán cà phê, tốc độ giảm kích thước tệp trong 24 giờ giữa H.264 và H.265+ là 82,5% và tỷ lệ giữa H.265 và H.265+ là 66,4%.
  • Đối với camera giám sát ở ngã tư đường, tốc độ giảm kích thước tệp trong 24 giờ giữa H.264 và H.265+ là 79,4% và tỷ lệ giữa H.265 và H.265+ là 64,5%.

Như vậy, công nghệ nén hình Hikvision H.265+ có thể giảm đáng kể kích thước tệp trong giám sát cả ngày và giảm chi phí mua ổ cứng hoặc thẻ nhớ cho bạn.

4. Tổng kết

Công nghệ chuẩn nén hình H.265+ của Hikvision là một công nghệ mã hóa được tối ưu hóa dựa trên nén chuẩn H.265 / HEVC. Với H.265+, chất lượng video gần như tương đương với H.265 / HEVC nhưng có ít băng thông truyền tải và dung lượng lưu trữ cần thiết. Nó mở giúp bạn lưu được những video có độ phân giải 2K, 4K trên các camera 8MP và 12MP.

Cuối cùng, chuẩn nén hình Hikvision H.265+ vẫn đáp ứng tiêu chuẩn H.265 / HEVC và nó tương thích với hầu hết các phần mềm / phần cứng của các hãng có hỗ trợ H.265. Nó đóng một vai trò quan trọng trong việc cắt giảm chi phí mua ổ cứng lưu trữ và thúc đẩy sự phổ biến của những camera có độ nét siêu cao lên đến 2K, 4K

Tham khảo thêm