Google ra mắt công nghệ AI mới giúp biến ảnh có độ phân giải thấp thành ảnh chất lượng cao

by X Công Nghệ

Google vừa giới thiệu các mô hình khuếch tán dựa trên công nghệ AI mới để cải thiện chất lượng của hình ảnh có độ phân giải thấp.

Hai công nghệ mới là mô hình khuếch tán siêu phân giải (SR3) và mô hình khuếch tán theo tầng (CDM) có thể sử dụng AI để tạo ra hình ảnh có độ phân giải cao hơn và nét hơn. Công nghệ này có nhiều ứng dụng trong thực tế như khôi phục ảnh chân dung gia đình cũ và cải thiện hệ thống hình ảnh y tế…

SR3 là mô hình khuếch tán siêu phân giải có thể khử nhiễu từ các ảnh có độ phân giải thấp để tạo ra ảnh có độ phân giải cao. AI được đào tạo về quy trình làm nhiễu dần dần một bức ảnh có độ phân giải cao, sau đó đảo ngược quá trình đó để hiểu được cách khôi phục chất lượng ảnh.

Google đã chia sẻ một vài ví dụ ấn tượng về cách một hình ảnh có độ phân giải 64×64 pixel được thu nhỏ thành ảnh có độ phân giải 1.024×1.024 pixel bằng SR3. Google nói rằng SR3 có thể đạt được hiệu quả tốt nhất khi gia tăng độ phân giải cho các hình ảnh khuôn mặt và thiên nhiên từ 4 đến 8 lần.

Mô hình khuếch tán CDM được đào tạo dựa trên dữ liệu ImageNet để tạo ra hình ảnh tự nhiên có độ phân giải cao. Vì ImageNet là một tập dữ liệu khó, nên Google đã xây dựng CDM như một chuỗi gồm nhiều mô hình khuếch tán. Cách tiếp cận theo tầng này liên quan đến việc xâu chuỗi nhiều mô hình tổng hợp lại với nhau trên một số độ phân giải.

Chuỗi này sẽ bao gồm một mô hình khuếch tán tạo ra dữ liệu ở độ phân giải thấp, tiếp theo là chuỗi mô hình khuếch tán siêu phân giải SR3 tăng dần độ phân giải của hình ảnh được tạo lên độ phân giải cao nhất.

Google cho biết họ áp dụng Gaussian noise và Gaussian blur cho hình ảnh đầu vào có độ phân giải thấp của mỗi mô hình siêu phân giải. Với SR3 và CDM, Google cho biết họ đã đạt được tiến bộ vượt bậc trong việc nâng cao chất lượng hình ảnh có độ phân giải thấp.

Xem Thêm