1. Học máy là gì?
Học máy hay máy học (Machine Learning) là một loại trí tuệ nhân tạo (AI) cho phép các ứng dụng phần mềm trở nên chính xác hơn trong việc dự đoán kết quả mà không cần được lập trình rõ ràng để làm như vậy. Các thuật toán học máy sử dụng dữ liệu lịch sử làm đầu vào để dự đoán các giá trị đầu ra mới.
Hệ thống đề xuất là một trường hợp sử dụng phổ biến của học máy. Các ứng dụng phổ biến khác bao gồm phát hiện gian lận, lọc thư rác, phát hiện mối đe dọa phần mềm độc hại, tự động hóa quy trình kinh doanh (BPA) và dự đoán.
2. Tại sao học máy lại quan trọng?
Học máy rất quan trọng vì nó cung cấp cho doanh nghiệp cái nhìn về xu hướng trong hành vi của khách hàng và mô hình hoạt động kinh doanh, cũng như hỗ trợ sự phát triển của các sản phẩm mới. Nhiều công ty hàng đầu hiện nay, chẳng hạn như Facebook, Google và Uber, biến học máy trở thành một phần trọng tâm trong hoạt động của họ. Học máy đã trở thành một yếu tố khác biệt trong cạnh tranh đáng kể đối với nhiều công ty.
3. Phân biệt các loại học máy
Học máy cổ điển thường được phân loại theo cách một thuật toán học để trở nên chính xác hơn trong các dự đoán của nó. Có bốn cách tiếp cận cơ bản: học có giám sát, học không giám sát, học bán giám sát và học tăng cường. Loại thuật toán mà các nhà khoa học sử dụng tùy thuộc vào loại dữ liệu họ muốn dự đoán.
- Học có giám sát: Trong loại học máy này, các nhà khoa học dữ liệu cung cấp các thuật toán với dữ liệu huấn luyện được gắn nhãn và xác định các biến mà họ muốn thuật toán đánh giá để tìm mối tương quan. Cả đầu vào và đầu ra của thuật toán đều được chỉ định.
- Học không giám sát: Loại học máy này liên quan đến các thuật toán đào tạo trên dữ liệu không được gắn nhãn. Thuật toán quét qua các tập dữ liệu để tìm kiếm bất kỳ kết nối có ý nghĩa nào. Dữ liệu mà các thuật toán đào tạo cũng như các dự đoán hoặc khuyến nghị mà chúng xuất ra được xác định trước.
- Học bán giám sát: Cách tiếp cận này đối với học máy liên quan đến sự kết hợp của hai loại trước đó. Các nhà khoa học dữ liệu có thể cung cấp một thuật toán chủ yếu là dữ liệu đào tạo được gắn nhãn, nhưng mô hình có thể tự do khám phá dữ liệu và phát triển sự hiểu biết của riêng mình về tập dữ liệu.
- Học tăng cường: Các nhà khoa học dữ liệu thường sử dụng học tăng cường để dạy máy hoàn thành một quy trình gồm nhiều bước trong đó có các quy tắc được xác định rõ ràng. Các nhà khoa học lập trình một thuật toán để hoàn thành một nhiệm vụ và cung cấp cho nó những dấu hiệu tích cực hoặc tiêu cực khi nó tìm ra cách hoàn thành một nhiệm vụ. Nhưng phần lớn, thuật toán tự quyết định những bước cần thực hiện trong quá trình thực hiện.
3.1. Học máy có giám sát hoạt động như thế nào?
Học máy có giám sát yêu cầu nhà khoa học đào tạo thuật toán với cả đầu vào được gắn nhãn và đầu ra mong muốn. Các thuật toán học tập có giám sát phù hợp với các tác vụ sau:
- Phân loại nhị phân: Chia dữ liệu thành hai loại.
- Phân loại nhiều lớp: Lựa chọn giữa nhiều hơn hai loại câu trả lời.
- Mô hình hồi quy: Dự đoán các giá trị liên tục.
- Ghép nối: Kết hợp các dự đoán của nhiều mô hình học máy để tạo ra dự đoán chính xác.
3.2. Học máy không giám sát hoạt động như thế nào?
Các thuật toán học máy không giám sát không yêu cầu dữ liệu phải được gắn nhãn. Chúng sàng lọc dữ liệu không được gắn nhãn để tìm kiếm các mẫu có thể được sử dụng để nhóm các điểm dữ liệu thành các tập hợp con. Hầu hết các loại học sâu, bao gồm cả mạng thần kinh nhân tạo, đều là các thuật toán không được giám sát. Các thuật toán học tập không giám sát tốt cho các tác vụ sau:
- Phân cụm: Tách tập dữ liệu thành các nhóm dựa trên sự giống nhau.
- Phát hiện bất thường: Xác định các điểm dữ liệu bất thường trong tập dữ liệu.
- Khai thác liên kết: Xác định các tập hợp các mục trong tập dữ liệu thường xuyên xảy ra cùng nhau.
- Giảm kích thước: Giảm số lượng biến trong tập dữ liệu.
3.3. Học máy bán giám sát hoạt động như thế nào?
Học máy bán giám sát hoạt động khi các nhà khoa học cung cấp một lượng nhỏ dữ liệu đào tạo được gắn nhãn cho một thuật toán. Từ đó, thuật toán tìm hiểu các kích thước của tập dữ liệu, sau đó nó có thể áp dụng cho dữ liệu mới, chưa được gắn nhãn. Hiệu suất của các thuật toán thường được cải thiện khi chúng đào tạo trên các tập dữ liệu được gắn nhãn. Nhưng việc ghi nhãn dữ liệu có thể tốn thời gian và tốn kém. Học máy bán giám sát đặt nền tảng trung gian giữa hiệu suất của học máy có giám sát và hiệu quả của học máy không giám sát. Một số lĩnh vực sử dụng phương pháp học máy bán giám sát bao gồm:
- Dịch máy: Dạy các thuật toán dịch ngôn ngữ dựa trên ít hơn một từ điển đầy đủ các từ.
- Phát hiện gian lận: Xác định các trường hợp gian lận khi bạn chỉ có một vài ví dụ tích cực.
- Dán nhãn dữ liệu: Các thuật toán được đào tạo trên tập dữ liệu nhỏ có thể học cách áp dụng nhãn dữ liệu cho các tập lớn hơn một cách tự động.
3.4. Học máy tăng cường hoạt động như thế nào?
Học máy tăng cường hoạt động bằng cách lập trình một thuật toán với một mục tiêu riêng biệt và một bộ quy tắc được chỉ định để hoàn thành mục tiêu đó. Các nhà khoa học cũng lập trình thuật toán để tìm kiếm phần thưởng tích cực – mà nó nhận được khi thực hiện một hành động có lợi cho mục tiêu cuối cùng – và tránh các hình phạt – mà nó nhận được khi thực hiện một hành động khiến nó càng xa mục tiêu cuối cùng. Học máy tăng cường thường được sử dụng trong các lĩnh vực như:
- Robot: Robot có thể học cách thực hiện các nhiệm vụ trong thế giới thực bằng cách sử dụng kỹ thuật này.
- Trò chơi video: Học máy tăng cường đã được sử dụng để dạy bot chơi một số trò chơi điện tử.
- Quản lý nguồn lực: Với nguồn lực hữu hạn và một mục tiêu xác định, việc học máy tăng cường có thể giúp doanh nghiệp lập kế hoạch phân bổ nguồn lực.
4. Học máy được sử dụng để làm gì?
Ngày nay, học máy được sử dụng trong một loạt các ứng dụng. Có lẽ một trong những ví dụ nổi tiếng nhất về hoạt động của học máy là hệ thống đề xuất News Feed của Facebook.
Facebook sử dụng công nghệ học máy để cá nhân hóa cách thức hiển thị bài viết cho mỗi người dùng. Nếu một người dùng thường xuyên dừng lại để đọc bài đăng của một nhóm cụ thể, công cụ đề xuất sẽ ưu tiên hiển thị nhiều hoạt động của nhóm đó hơn trong News Feed của người dùng đó.
Ngoài ra, hệ thống còn cố gắng củng cố các mô hình đã biết trong hành vi trực tuyến của người dùng. Nếu người dùng thay đổi thói quen và không đọc các bài đăng từ nhóm đó trong những tuần tới thì News Feed sẽ tự động điều chỉnh cho phù hợp.
Ngoài các công cụ đề xuất, các ứng dụng khác cho học máy bao gồm:
- Quản trị quan hệ khách hàng. Phần mềm CRM có thể sử dụng mô hình học máy để phân tích email và nhắc nhở các thành viên trong nhóm bán hàng trả lời những thông điệp quan trọng nhất trước. Các hệ thống nâng cao hơn thậm chí có thể đề xuất các phản hồi tiềm năng hiệu quả.
- Kinh doanh thông minh. Các nhà cung cấp BI và phân tích sử dụng học máy trong phần mềm của họ để xác định các điểm dữ liệu quan trọng tiềm ẩn, các mẫu điểm dữ liệu và các điểm bất thường.
- Hệ thống thông tin nguồn nhân lực. Hệ thống HRIS có thể sử dụng mô hình học máy để lọc thông qua các ứng dụng và xác định các ứng viên tốt nhất cho một vị trí.
- Xe ô tô tự lái. Các thuật toán học máy có thể giúp một chiếc xe bán tự hành nhận ra một đối tượng và cảnh báo cho người lái xe.
- Trợ lý ảo. Trợ lý thông minh thường kết hợp các mô hình học máy có giám sát và không giám sát để diễn giải giọng nói tự nhiên và ngữ cảnh cung cấp.
5. Ưu điểm và nhược điểm của học máy là gì?
Học máy đã được sử dụng trong nhiều trường hợp khác nhau, từ dự đoán hành vi của khách hàng đến việc hình thành hệ điều hành cho xe ô tô tự lái.
Khi nói đến lợi thế, học máy có thể giúp doanh nghiệp hiểu khách hàng của họ ở mức độ sâu hơn. Bằng cách thu thập dữ liệu khách hàng và tương quan nó với các hành vi theo thời gian, các thuật toán học máy có thể tìm hiểu các liên kết và giúp các nhóm điều chỉnh các sáng kiến tiếp thị và phát triển sản phẩm cho phù hợp với nhu cầu của khách hàng.
Một số công ty sử dụng học máy như một động lực chính trong các mô hình kinh doanh của họ. Ví dụ, Uber sử dụng các thuật toán để hiển thị tài xế cho người tìm xe. Google sử dụng công nghệ học máy để hiển thị quảng cáo phù hợp trong các kết quả tìm kiếm.
Nhưng học máy đi kèm với những nhược điểm. Đầu tiên và quan trọng nhất, nó có thể tốn kém. Bởi mức lương dành cho các nhà khoa học dữ liệu tham gia trong các dự án học thường thường rất cao. Và các dự án này cũng yêu cầu cơ sở hạ tầng phần mềm có thể tốn kém.
Ngoài ra còn có vấn đề sai lệch về học máy. Các thuật toán được đào tạo trên các tập dữ liệu loại trừ một số quần thể nhất định hoặc có lỗi có thể dẫn đến các mô hình không chính xác, tốt nhất là thất bại và tệ nhất là phân biệt đối xử. Khi một doanh nghiệp đặt các quy trình kinh doanh cốt lõi dựa trên các mô hình phân biệt đối xử, doanh nghiệp đó có thể gặp tổn hại về quy định và uy tín.
6. Cách chọn mô hình học máy phù hợp
Quá trình lựa chọn mô hình học máy phù hợp để giải quyết một vấn đề có thể tốn thời gian nếu không được tiếp cận một cách chiến lược.
Bước 1: Điều chỉnh vấn đề với đầu vào dữ liệu tiềm năng cần được xem xét cho giải pháp. Bước này cần sự trợ giúp từ các nhà khoa học dữ liệu và các chuyên gia hiểu sâu về vấn đề.
Bước 2: Thu thập dữ liệu, định dạng và dán nhãn dữ liệu nếu cần. Bước này thường được dẫn dắt bởi các nhà khoa học dữ liệu, với sự trợ giúp từ các trình bao bọc dữ liệu.
Bước 3: Chọn (các) thuật toán để sử dụng và kiểm tra để xem chúng hoạt động như thế nào. Bước này thường được thực hiện bởi các nhà khoa học dữ liệu.
Bước 4: Tiếp tục tinh chỉnh kết quả đầu ra cho đến khi chúng đạt đến mức độ chính xác có thể chấp nhận được. Bước này thường được thực hiện bởi các nhà khoa học dữ liệu với phản hồi từ các chuyên gia hiểu sâu về vấn đề.
7. Tầm quan trọng của việc giải thích mô hình học máy cho người sử dụng
Việc giải thích cách thức hoạt động của một mô hình học máy cụ thể có thể là một thách thức khi mô hình phức tạp. Có một số ngành dọc nơi các nhà khoa học dữ liệu phải sử dụng các mô hình học máy đơn giản vì điều quan trọng là doanh nghiệp phải giải thích cách mọi quyết định được đưa ra. Điều này đặc biệt đúng trong các ngành nghiêm ngặt như ngân hàng và bảo hiểm.
Các mô hình phức tạp có thể đưa ra các dự đoán chính xác, nhưng việc giải thích cho một người bình thường về cách xác định kết quả đầu ra có thể không đơn giản.
8. Tương lai của học máy sẽ như thế nào?
Mặc dù các thuật toán học máy đã tồn tại trong nhiều thập kỷ, nhưng chúng đã đạt được mức độ phổ biến mới khi trí tuệ nhân tạo ngày càng phát triển. Đặc biệt, các mô hình học sâu cung cấp nền tảng cho các ứng dụng AI tiên tiến nhất hiện nay.
Các nền tảng học máy là một trong những lĩnh vực cạnh tranh nhất của các tập đoàn công nghệ, với hầu hết các nhà cung cấp lớn, bao gồm Amazon, Google, Microsoft, IBM… đang chạy đua để tranh giành khách hàng sử dụng các dịch vụ nền tảng bao gồm các hoạt động học máy, thu thập dữ liệu, chuẩn bị dữ liệu, phân loại dữ liệu, xây dựng mô hình, đào tạo và triển khai ứng dụng.
Khi học máy tiếp tục tăng tầm quan trọng đối với hoạt động kinh doanh và AI trở nên thực tế hơn trong các môi trường doanh nghiệp, cuộc chiến nền tảng học máy sẽ ngày càng gay gắt.
Tiếp tục nghiên cứu sâu hơn và AI ngày càng tập trung vào việc phát triển các ứng dụng tổng quát hơn. Các mô hình AI ngày nay đòi hỏi phải được đào tạo chuyên sâu để tạo ra một thuật toán được tối ưu hóa cao để thực hiện một nhiệm vụ. Nhưng một số nhà nghiên cứu đang khám phá cách để làm cho các mô hình linh hoạt hơn và đang tìm kiếm các kỹ thuật cho phép học máy áp dụng ngữ cảnh đã học từ một nhiệm vụ cho các nhiệm vụ khác nhau trong tương lai.
9. Lịch sự phát triển của học máy
1642 – Blaise Pascal phát minh ra một cỗ máy cơ học có thể cộng, trừ, nhân và chia.
1679 – Gottfried Wilhelm Leibniz phát minh ra hệ thống mã nhị phân.
1834 – Charles Babbage hình thành ý tưởng về một thiết bị đa năng có thể được lập trình với các thẻ đục lỗ.
1842 – Ada Lovelace mô tả một chuỗi các phép toán để giải quyết các vấn đề toán học bằng cách sử dụng máy đục lỗ lý thuyết của Charles Babbage và trở thành lập trình viên đầu tiên.
1847 – George Boole tạo ra logic Boolean, một dạng đại số trong đó tất cả các giá trị có thể được rút gọn thành các giá trị nhị phân của true hoặc false.
1936 – Nhà lôgic học và nhà phân tích mật mã người Anh Alan Turing đề xuất một cỗ máy vạn năng có thể giải mã và thực thi một tập hợp các lệnh. Chứng minh được công bố của ông được coi là cơ sở của khoa học máy tính.
1952 – Arthur Samuel tạo ra một chương trình để giúp máy tính IBM có khả năng kiểm tra càng tốt càng tốt.
1959 – MADALINE trở thành mạng thần kinh nhân tạo đầu tiên được áp dụng cho một vấn đề trong thế giới thực: loại bỏ tiếng vọng từ đường dây điện thoại.
1985 – Mạng thần kinh nhân tạo của Terry Sejnowski và Charles Rosenberg đã tự học cách phát âm chính xác 20.000 từ trong một tuần.
1997 – Deep Blue của IBM đánh bại kiện tướng cờ vua Garry Kasparov.
1999 – Một máy trạm thông minh nguyên mẫu CAD đã xem xét 22.000 hình ảnh chụp X quang tuyến vú và phát hiện ung thư chính xác hơn 52% so với các bác sĩ X quang.
2006 – Nhà khoa học máy tính Geoffrey Hinton phát minh ra thuật ngữ học sâu để mô tả nghiên cứu mạng thần kinh nhân tạo.
2012 – Một mạng thần kinh nhân tạo không giám sát do Google tạo ra đã học cách nhận dạng mèo trong video YouTube với độ chính xác 74,8%.
2014 – Một chatbot vượt qua Bài kiểm tra Turing bằng cách thuyết phục 33% người đánh giá rằng đó là một thiếu niên Ukraine tên là Eugene Goostman.
2014 – AlphaGo của Google đánh bại nhà vô địch con người trong cờ vây, trò chơi trên bàn cờ khó nhất trên thế giới.
2016 – LipNet, hệ thống trí tuệ nhân tạo của DeepMind, xác định các từ đọc bằng môi trong video với độ chính xác 93,4%.
2019 – Amazon kiểm soát 70% thị phần trợ lý ảo ở Hoa Kỳ.