Tìm hiểu về trợ lý ảo trên các hệ điều hành, đâu là trợ lý ảo phổ biến nhất hiện nay?

Vũ Chí Dũng 18/12/22 Trợ lý ảo trên các hệ điều hành là gì? Đâu là những trợ lý ảo phổ biến hiện nay?

Ngày nay, trợ lý ảo đang là xu hướng công nghệ được đón đầu. Trong đó không thể không kể tới những tên tuổi như: Apple Siri, Google Assistant, Microsoft Cortana,… Trong bài viết này, hãy cùng 24h Công nghệ tìm hiểu về Trợ lý ảo là gì? Trợ lý ảo trên các hệ điều hành là gì và phần mềm này có khả năng hỗ trợ người dùng như thế nào nhé.

Nội dung bài viết

Trợ lý ảo là gì? Trợ lý ảo trên các hệ điều hành là gì?

Trợ lý ảo là một công nghệ AI được lập trình để hướng đến nhiệm vụ, nhận dạng giọng nói của con người để thực hiện lệnh đó. Mục đích của nó là hỗ trợ người dùng thiết bị dễ dàng hơn bằng chính thói quen sử dụng điện thoại hàng ngày của họ.

Các trợ lý ảo có thể tiếp nhận dữ liệu và đưa ra những gợi ý chính xác đến người dùng. Nguồn: Microsoft.

Việc được phát triển dựa trên các mô hình Machine Learning giúp cho các trợ lý ảo này có thể không ngừng tiếp nhận dữ liệu từ người dùng, từ đó các thao tác thực hiện lệnh sau này sẽ nhanh, chính xác và giống con người hơn. Từ đây, sẽ giúp cho trợ lý hiểu và giúp ích được cho bạn nhiều hơn trong cả công việc lần lúc nghỉ ngơi.

Người dùng có thói quen dùng các trợ lý ảo trên điện thoại. Nguồn: Objectismartphone.

Các trợ lý ảo như Siri, Cortana hay Google Assistant được tích hợp trong nhiều thiết bị như điện thoại, máy tính, TV, đồng hồ thông minh,… Và trong tương lai tới, số lượng Trợ lý ảo có khả năng tích hợp sâu vào các thiết bị điện tử như thế này sẽ còn gia tăng nhanh chóng nhờ sự bùng nổ của công nghệ số.

Trợ lý ảo làm được những gì?

Hiện nay thì các trợ lý ảo nổi tiếng như Siri, Google Assistant hay Samsung Bixby đều có hỗ trợ người dùng tương tác theo nhiều phương pháp khác nhau, mà chủ yếu nhất vẫn là thông qua văn bản và giọng nói.​

Ưu điểm đến từ những trợ lý ảo đó là khả năng tìm kiếm thông tin rất nhanh trên Internet, và nhờ đó chỉ trong vòng tích tắc, các trợ lý ảo như Siri hay Alexa có thể trả lời câu hỏi của bạn. Ví dụ, nếu bạn đang không biết cách làm một món ăn hay sử dụng một thiết bị nào đó. Thì hãy mở trợ lý của mình lên và đặt câu hỏi cho nó nhé.

Một số trợ lý ảo sẽ được tích hợp sâu vào trong hệ điều hành của các thiết bị điện tử. Nguồn: Microsoft.

Một số trợ lý ảo sẽ được tích hợp sâu vào trong hệ điều hành của các thiết bị điện tử, vậy nên khả năng thao tác lệnh của các trợ lý ảo nhờ đây cũng được mở rộng ra. Với một số mẫu nhà smarthome hiện tại, việc sử dụng một trợ lý ảo sẽ giúp gia chủ có thể ra lệnh, điều khiển một cách tiện lợi và nhanh nhất.

Đâu là trợ lý ảo phổ biến nhất hiện nay?

Như mình đã chia sẻ, thì hiện nay có khá nhiều phần mềm trợ lý ảo được phát triển. Và theo như đánh giá dựa trên trải nghiệm của mình, đây chính là TOP 4 trợ lý ảo mà mình cảm thấy tiện lợi và hữu dụng nhất, muốn chia sẻ đến bạn đọc.

*Danh sách được mình sắp xếp theo thứ tự ngẫu nhiên bạn nha.

1. Siri: Trợ lý ảo Apple

Siri là trợ lý kỹ thuật số được tích hợp sẵn trên các thiết bị của Apple. Nguồn: MacRumors.

Siri là trợ lý kỹ thuật số được tích hợp sẵn trên các thiết bị của Apple được điều khiển bằng giọng nói trực tiếp để tìm kiếm hoặc thực hiện công việc trên thiết bị theo yêu cầu của người dùng.

Tìm kiếm bằng Siri được người dùng đánh giá cao và khen ngợi về sự tiện dụng của nó. Siri có thể sử dụng rất nhiều dịch vụ website, lấy dữ liệu từ nhiều nguồn khác nhau để đem lại kết quả gọn gàng cho những gì bạn tìm kiếm.

Tìm kiếm bằng Siri được người dùng đánh giá cao và khen ngợi về sự tiện dụng của nó. Nguồn: 9to5Mac.

Bạn có thể đặt câu hỏi, yêu cầu Siri chỉ cho bạn điều gì đó hoặc làm việc thay khi không rảnh tay. Với các dòng iOS ở những phiên bản trước, thì ta phải nhấn giữ nút home và nói “Hey siri” là ta đã có thể kích hoạt chúng.

Apple đang tìm cách giúp người dùng kích hoạt Siri chỉ bằng một từ Siri. Nguồn: 9to5Mac.

Nhưng với sự cải tiến về công nghệ và định hướng phát triển của các mẫu sản phẩm của Apple hiện nay, hãng đang có dự định bỏ chữ “hey” trong tương lai gần và chỉ cần nói “Siri” là đã có thể thực hiện lệnh nói rồi, quá là giản đơn và tiện dụng phải không? Ví dụ, bạn muốn tìm hiểu về chó, gọi “Siri” và nói “Dog”, Siri sẽ tìm kiếm và đưa ra thông tin chính xác mà bạn muốn.

Bạn có thể thực hiện thao tác nhắn tin chỉ với Airpods và Siri.

Ngoài ra, Siri có thể giúp bạn thực hiện và kết thúc một cuộc gọi, đặt đồng hồ báo thức, tạo lịch hẹn hay kể cả viết tin nhắn giúp bạn luôn đó! Chỉ cần nói “Siri”, tất cả mọi thứ xung quanh bạn đều sẽ được giải quyết một cách tiện lợi và hữu dụng hơn rất nhiều.

2. Google Assistant: Trợ lý ảo Google

Khác với Siri, Google Assistant có mặt trên tất cả các dòng Android. Ngay cả iPhone, nếu bạn sử dụng Google Chrome thì nó cũng có trợ lý ảo để bạn có thể sử dụng.

Google Assistant có mặt trên tất cả các dòng Android.

Điều đặc biệt, hiện nay Google đã hỗ trợ bản tiếng Việt cho người dùng tại Việt Nam, nên chúng ta rất dễ để sử dụng chúng. Về chức năng thì Google Assitant có trên mình tất cả những gì mà một trợ lý cần có. Từ việc mở ứng dụng, đọc tin nhắn, phát nhạc,… cho đến thực hiện nhiều công việc như thực hiện cuộc gọi bằng khẩu lệnh đều có thể thực hiện tốt.

Giao tiếp thông minh và có khả năng trò chuyện, hiểu ý người dùng là điểm nổi bật nhất của trợ lý ảo Google Assistant.

Người đại diện của Google đã từng nói “Càng được sử dụng nhiều, Google Assistant càng thông minh”. Đúng là vậy, giao tiếp thông minh và có khả năng trò chuyện, hiểu ý người dùng là điểm mạnh nhất và nổi bật nhất của trợ lý ảo này. Bởi thay vì hỗ trợ thông tin một chiều là người dùng ra lệnh – trợ lý tìm. Thì với Google Assistant, luồng thông tin sẽ được thiết bị tiếp nhận và xử lý hai chiều. 

Google Assistant sẽ xuất hiện trên nhiều sản phẩm thiết bị khác nhau ngoài điện thoại di động.

Ngoài việc có tác dụng như một công cụ tìm kiếm thông minh, Google Assistant còn có thể giúp chúng ta ghi chú các nhắc nhở, sự kiện hay thậm chí là đặt trước chỗ trong một nhà hàng nào đó. Bên cạnh đó, Google Assistant cũng xuất hiện trên nhiều thiết bị điện tử ngoài điện thoại di động giúp tạo nên một hệ sinh thái thông minh, tiện lợi trên chính ngôi nhà của bạn đó.

3. Bixby: Trợ lý ảo Samsung

Bixby là trợ lý ảo của Samsung do chính Samsung phát triển. Nguồn: 9to5Google.

Bixby là trợ lý ảo của Samsung do chính Samsung phát triển. Trợ lý ảo Bixby của Samsung sử dụng trí tuệ nhân tạo (AI) và được tích hợp sẵn trong hệ điều hành để học hỏi thói quen sử dụng và giúp cải thiện trải nghiệm của người dùng với thiết bị.

Bixby có thể hiểu và nhận các yêu cầu tìm kiếm nội dung của người dùng thông qua giọng nói. Trợ lý ảo này khá thông minh với việc làm được rất nhiều các vai trò như là tìm kiếm thông tin, tải ứng dụng từ Google Play, điều khiển các ứng dụng tích hợp sẵn trên smartphone.

Bixby Routines là công nghệ AI trên điện thoại Samsung, có thể học thói quen và dự đoán nhu cầu của người dùng.

Bên cạnh đó, Bixby sẽ liên tục học hỏi hành vi của người dùng theo thời gian, để đưa ra những gợi ý các món ăn, nhà hàng hay những chỗ vui chơi giải trí để bạn có thể cùng người thân thương đi chơi sau những giờ học, làm việc mệt mỏi đó.

Bixby Home là 1 trang gồm các thẻ được sắp xếp ứng dụng, dịch vụ tạo ra trải nghiệm tiện lợi cho người dùng. nguồn: NeoCrawler.

Ngoài ra, trong tương lai Samsung cũng đã lên kế hoạch đưa Bixby lên các thiết bị gia dụng của hãng chứ không chỉ riêng trên smartphone. Về cơ bản, bất cứ thiết bị nào có mic thoại và kết nối Internet sẽ đều có thể sử dụng Bixby kể cả máy giặt, lò vi sóng hay tủ lạnh. Hãy để Bixby phục vụ bạn tận tình nhé!

4. Cortana: Trợ lý ảo Window

Khá là đáng tiếc vì Cortana chưa hỗ trợ ngôn ngữ Việt Nam. Nguồn: Microsoft.

Cortana là một trợ lý ảo dành riêng cho hệ điều hành Windows được sáng tạo bởi Microsoft. Dù chưa được hỗ trợ Tiếng Việt, nhưng người dùng chỉ có thể sử dụng tiếng Anh, Pháp, Đức, Italia, Trung Quốc, Tây Ban Nha, Nhật Bản và Bồ Đào Nha khi sử dụng Cortana cũng khá là đa dạng đó.

Cortana là trợ lý kỹ thuật số được tích hợp sẵn trên các thiết bị của Microsoft. Nguồn: MacRumors.

Không cần sử dụng tới bàn phím, bạn vẫn có thể yêu cầu Cortana làm việc theo chỉ thị bằng giọng nói. Cô trợ lý ảo này có thể giúp bạn đặt lời nhắc, tra cứu thông tin, tìm kiếm nhạc, tắt bật WiFi,… Ngoài ra, bạn cũng có thể hỏi Cortana những câu hỏi thông thường như nói chuyện với một người bạn.

Trợ lý ảo Cortana có thể tra cứu mọi thông tin dựa trên công cụ tìm kiếm Bing .

Trợ lý ảo Cortana có thể tra cứu mọi thông tin dựa trên công cụ tìm kiếm Bing nhờ tính năng tích hợp vào trình duyệt Edge của Windows 10. Đối với những câu hỏi đơn giản, Cortana sẽ hiển thị đáp án ngay trong cửa sổ tìm kiếm.

Trái lại, đối với những câu hỏi khó hơn thì sẽ mất thêm một chút thời gian để Cortana có thể tự động mở trình duyệt web đi kèm với danh sách kết quả tìm được.

Tổng kết

Trên đây là những thông tin trả lời cho câu hỏi “trợ lý ảo trên các hệ điều hành là gì?” và các thông tin bên lề của các trợ lý ảo phổ biến nhất hiện nay. Dưới đây là loạt điện thoại có có trợ lý ảo, mình gửi đến bạn để bạn có thể khám phá thỏa thích tính năng này nhé!

Vậy bạn nghĩ sao về trợ lý ảo? Liệu bạn có lựa chọn các mẫu điện thoại thế hệ mới để sử dụng trợ lý ảo? Hãy để lại bình luận phía bên dưới cho mình và mọi người cùng biết nhé! 

Cơ hội hiếm có khó tìm, Thế Giới Di Động đang có chương trình giảm giá lớn, deal sốc ngập trời cho các sản phẩm điện thoại, máy tính bảng, phụ kiện,… Chi tiết chương trình các bạn có thể tham khảo tại nút cam bên dưới nha. Cám ơn các bạn đã theo dõi bài viết.

CHƯƠNG TRÌNH KHUYẾN MÃI TẠI TGDĐ

  • Apple có thể đang cải tiến lại trợ lý ảo Siri giúp kêu gọi dễ dàng hơn
  • Những cập nhật mới của Siri trên iOS 16 sẽ làm iFans cực kỳ hứng thú!
  • Cách cập nhật Google Assistant Tiếng Việt cho Samsung Galaxy Watch 4
Biên tập bởi Vũ Chí Dũng Không hài lòng bài viết
— Cập nhật: 11-01-2023 — tungchinguyen.com tìm được thêm bài viết Lập Trình Trợ Lý Ảo Tiếng Việt Toàn Diện Với Python từ website codelearn.io cho từ khoá cách tạo trợ lý ảo.

Ngoài Siri của Apple, Alexa của Amazon và gần đây là Google Asisstant của Google, còn gì tuyệt vời hơn khi biết bạn cũng có thể tự tạo cho mình một con trợ lý ảo, ngay cả phiên bản tiếng việt. Nào bắt tay vào làm thôi.

Trong bài viết, mình sẽ đi chi tiết làm thế nào để viết một trở lý ảo tiếng việt bằng Python, mình gọi tên cậu ấy là Alex.

Nhiều bạn vẫn chưa thực sự được tiếp cận với trí tuệ nhân tạo hay cụ thể hơn là xử lý ngôn ngữ tự nhiên hay một con trợ lý ảo nghĩa là gì. Thực sự, trí tuệ nhân tạo nói chung và xử lý ngôn ngữ tự nhiên đóng góp to lớn như thế nào đối với ngành công nghệ thông tin. Mình chọn sử dung python, Python là một ngôn ngữ lập trình có một bộ thư viện đa năng. Nên trí tuệ nhân tạo bây giờ cũng trở nên đơn giản hơn với chúng ta. Mình sẽ cụ thể hóa các chi tiết giúp bạn hình dung những công việc để làm một con trợ lý ảo nhé.

Trợ lý ảo đã phát triển thế nào?

Timeline trợ lý ảo từ 2010 đến nay

Gần đây, Trợ lý ảo đã có được nền tảng chính sau khi Apple tích hợp Trợ lý ảo đáng kinh ngạc nhất – Siri, chính thức là một phần của Apple Inc. Nhưng dòng thời gian của sự tiến hóa vĩ đại nhất bắt đầu từ sự kiện năm 1962 tại Hội chợ Thế giới Seattle nơi IBM trưng bày bộ máy độc đáo gọi là Shoebox. Đó là kích thước thực tế của một hộp đựng giày và có thể thực hiện các chức năng khoa học và có thể nhận biết 16 từ và cũng có thể nói chúng bằng giọng nói dễ nhận biết của con người với 0 đến 9 chữ số.

Sau đó trong giai đoạn những năm 1970, các nhà nghiên cứu tại Đại học Carnegie Mellon ở Pittsburgh, Pennsylvania cùng với sự hỗ trợ của Bộ Quốc phòng Hoa Kỳ và Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến (DARPA) – đã tạo ra chiếc máy Harpy. Nó có thể hiểu gần 1.000 từ, gần bằng từ vựng của một đứa trẻ ba tuổi.

Vào tháng 4 năm 1997, Dragon NataturalSpeaking là phần mềm chỉnh sửa chính tả đầu tiên có thể hiểu khoảng 100 từ và biến nó thành nội dung có thể đọc được. Theo dòng thời gian, xử lý ngôn ngữ tự nhiên và trợ lý ảo được đầu tư nghiên cứu mạnh mẽ, trải qua những cột mốc quan trọng và đạt được thành tựu thông minh như ngày hôm nay.

Kiến thức cần có

  • AI – Artificial Intelligence hay còn gọi là Trí tuệ nhân tạo là một ngành khoa học, kỹ thuật chế tạo máy móc thông minh, đặc biệt là các chương trình máy tính thông minh. AI được thực hiện bằng cách nghiên cứu cách suy nghĩ của con người, cách con người học hỏi, quyết định và làm việc trong khi giải quyết một vấn đề nào đó, và sử dụng những kết quả nghiên cứu này như một nền tảng để phát triển các phần mềm và hệ thống thông minh, từ đó áp dụng vào các mục đích khác nhau trong cuộc sống. Nói một cách dễ hiểu thì AI là việc sử dụng, phân tích các dữ liệu đầu vào nhằm đưa ra sự dự đoán rồi đi đến quyết định cuối cùng.
  • Xử lý ngôn ngữ tự nhiên ( – NLP) là một nhánh của trí tuệ nhân tạo tập trung vào các ứng dụng trên ngôn ngữ của con người. Trong trí tuệ nhân tạo thì xử lý ngôn ngữ tự nhiên là một trong những phần khó nhất vì nó liên quan đến việc phải hiểu ý nghĩa ngôn ngữ-công cụ hoàn hảo nhất của tư duy và giao tiếp.
  • Trợ lý ảo (Virtual Assistant) hay còn gọi là trợ lý AI hay trợ lý kỹ thuật số, là chương trình ứng dụng được thiết kế để “hiểu” các lệnh thoại bằng ngôn ngữ tự nhiên và thực hiện các tác vụ cho người dùng. Các tác vụ này bao gồm đọc tin nhắn văn bản hoặc địa chỉ email, tìm kiếm số điện thoại, lên lịch, đặt cuộc gọi điện và nhắc nhở người dùng cuối về các cuộc hẹn.

Phải nói rằng, sẽ thật tuyệt vời nếu có thể tự mình tạo ra một trợ lý ảo ngay trên chiếc máy tính để bàn hay laptop của mình với các tiện ích đơn giản như:

  1. Giao tiếp, chào hỏi
  2. Cho bạn biết thời gian hiện tại
  3. Khởi chạy ứng dụng hệ thống và mở bất kỳ trang web nào trên trình duyệt Chrome
  4. Mở Google search và tìm kiếm thay cho bạn
  5. Gửi email đến những người trong danh bạ của bạn
  6. Cho bạn biết thời tết và nhiệt độ hiện tại của hầu hết mọi thành phố
  7. Phát cho bạn một bài hát trên Youtube
  8. Thay đổi hình nền máy tính
  9. Cho bạn biết tin tức mới nhất
  10. Nói cho bạn về hấu hết mọi thứ bạn yêu cầu

Do đó, ở trong bài viết này, mình sẽ xây dựng một ứng dụng tiếng việt có khả năng thực hiện tất cả các nhiệm vụ trên. Mình tương tác với trợ lý ảo trên laptop và mình sẽ gọi bạn ấy là Alex.

Nào chúng ta bắt đầu thôi. Let’s go !!!!

Nguyên liệu cần chuẩn bị

  • System requirements: Python 3.7.6, Jupyter notebook, Anaconda.
  • Libraries:
    • speech_recognition: Nhận dạng giọng nói
    • time, datetime: Xử lý thời gian
    • wikipedia: Tìm kiếm trên từ điển wikipedia
    • webbrowser, selenium, webdriver_manager, urllib: Truy cập web, trình duyệt (Chrome)
    • gTTS: Chuyển văn bản thành âm thanh của Google (Chị Google)
    • requests: Crawl thông tin từ web
    • smtplib: Gửi Email bằng giao thức SMTP
    • re: Biểu thức chính quy (Regular Expression) 
    • os, sys, ctypes: Truy cập, xử lý file hệ thống
    • playsound: Phát âm thanh từ file mp3
    • json: Xử lý kiểu dữ liệu JSON
    • youtube_search: Tìm kiếm video trên Youtube

Cài đặt

Anaconda là một công cụ tổng hợp đã tích hợp sẵn rất nhiều các gói phần mềm, thư viện giúp chúng ta có một môi trường để thực hiện xây dựng các ứng dụng Python. Anacoda cũng tích hợp sẵn conda bên trong do đó bạn chỉ cần cài đặt Anacoda là đủ.

Khi cài đặt xong, bạn mở Anaconda Prompt (có thể tìm thấy trong thư mục cài đặt Anaconda), di chuyển đến thư mục chứa project và thực hiện chạy Jupyter Notebook bằng câu lệnh:

jupyter notebook

Cuối cùng là việc cài đặt các thư viện cần thiết, chúng ta tiếp tục vào Anaconda Prompt và thực hiện cài các Python Package thông qua gói thư viện pip. Ví dụ, ta muốn cài đặt thư viện abcxyz thì gõ câu lệnh:

pip install abcxyz

Xây dựng trợ lý ảo tiếng việt Alex

1. Import các thư viện cần thiết

import os import playsound import speech_recognition as sr import time import sys import ctypes import wikipedia import datetime import json import re import webbrowser import smtplib import requests import urllib import urllib.request as urllib2 from selenium import webdriver from selenium.webdriver.common.keys import Keys from webdriver_manager.chrome import ChromeDriverManager from time import strftime from gtts import gTTS from youtube_search import YoutubeSearch

Ở trên, thư viện urlllib2 thực ra đã được thay thế bằng thư viện urllib.requesturllib ở phiên bản Python 3. Mình vẫn đặt tên là urllib2 để tránh nhầm lẫn.

Với mỗi chức năng mà trợ lý ảo thực hiện mình sẽ đại diện bằng một hàm. Mỗi hàm có thể trả về giá trị hoặc chỉ thực hiện lệnh tùy theo chức năng của nó.

Việc đầu tiên mình sẽ khai báo một vài biến để lưu đường dẫn hay các tham số để xử lý ngôn ngữ dưới dạng tiếng việt.

2. Khai báo biến mặc định

wikipedia.set_lang('vi') language = 'vi' path = ChromeDriverManager().install()

Hiện tại, các Lab nghiên cứu về trí tuệ nhân tạo ở Việt Nam đang đầu tư đẩy mạnh nghiên cứu mảng xử lý ngôn ngữ tự nhiên (Natural Language Processing) ở dạng tiếng việt và đã đạt được những kết quả đáng ghi nhận. Các mô hình nghiên cứu được có thể xử lý ngôn ngữ tiếng việt ở nhiều vùng miền, cả nam lẫn nữ, rất thực. Ở góc độ người sử dụng phổ thông thì khó có thể biết đâu là do máy tính, đâu là do người thực hiện. Các nghiên cứu đều có tính ứng dụng cao, đang được các công ty công nghệ áp dụng triển khai thực tế, nâng cao năng suất lao động một cách rõ rệt.

Các thư viện mình sử dụng ở trên đều rất phổ thông, tích hợp nhiều hàm xử lý. Tuy chất lượng xử lý tiếng việt chưa thực sự tuyệt vời nhưng ở góc độ bài viết thì mình thấy là khá ổn.

Mình lưu thêm biến path để lưu đường dẫn cài đặt Chrome để tránh việc cài đặt lại Chrome khi chạy lại hàm.

3. Chức năng chuyển văn bản thành âm thanh

Google Cloud Text To Speech

def speak(text): print("Bot: {}".format(text)) tts = gTTS(text=text, lang=language, slow=False) tts.save("sound.mp3") playsound.playsound("sound.mp3", False) os.remove("sound.mp3")

Chức năng đầu tiên mình cần là chuyển một đoạn văn bản thành âm thanh và đọc nó lên trên máy tính.

Mình sử dụng hàm gTTS (google Text To Speech) để chuyển văn bản thành âm thanh theo ngôn ngữ nhận dạng tiếng việt rồi lưu về máy tính dữ liệu âm thanh dưới file sound.mp3.

Sau đó, minh dùng hàm playsound.playsound() để đọc file sound.mp3 trên máy tính.

Sau khi đọc xong, mình phải xóa file sound.mp3 để tránh lỗi khi mình đọc một đoạn văn bản khác thì cũng được lưu lại dưới file sound.mp3.

4. Chức năng chuyển âm thanh thành văn bản

Quy trình chung hệ thống nhận dạng giọng nói

Đây là chức năng cơ bản thứ hai cùng với chức năng chuyển văn bản thành âm thanh.

Trong chức năng này, mình sử dụng 2 hàm khác hỗ trợ là get_audio() và stop()

def get_audio(): r = sr.Recognizer() with sr.Microphone() as source: print("Tôi: ", end='') audio = r.listen(source, phrase_time_limit=5) try: text = r.recognize_google(audio, language="vi-VN") print(text) return text except: print("...") return 0

Ở hàm trên, mình sử dụng thư viện speech_recognition (sr) có chức năng là nhận dạng giọng nói để chuyển âm thanh thành văn bản. Âm thanh được đọc vào microphone của máy tính sau đó được xử lý qua hàm listen của sr.Recognition rồi lưu dữ liệu âm thanh vào biến audio. Dữ liệu âm thanh audio thu được sẽ được nhận dạng ở ngôn ngữ tiếng việt trong hàm r.recognize_google để chuyển thành dạng văn bản rồi lưu dữ liệu vào biến text

Nếu dữ liệu âm thanh audio không lỗi tức là hàm r.recognize_google có thể nhận dạng được audio để chuyên thành text thì hàm get_audio() sẽ được trả về giá trị là text còn nếu dữ liệu audio bị lỗi mà hàm r.recognition_google không nhận dạng được thì hàm get_audio() sẽ được trả về giá trị là 0 (Mục đích là khi máy tính không hiểu mình nói gì thì mình sẽ thực hiện lại hàm get_audio() để đọc lại) 

def stop(): speak("Hẹn gặp lại bạn sau!")

Hàm stop() đơn giản là đọc đoạn text "Hẹn gặp lại bạn sau" sử dụng hàm speak() ở trên.

def get_text(): for i in range(3): text = get_audio() if text: return text.lower() elif i < 2: speak("Bot không nghe rõ. Bạn nói lại được không!") time.sleep(2) stop() return 0

Hàm get_text() có chức năng là máy tính sẽ cố gắng nhận dạng âm thanh của người đọc tối đa 3 lần cho đến khi máy tính hiểu. Mình sử dụng hàm for lặp lại 3 lần, nếu đoạn text có giá trị khác 0 thì hàm get_text sẽ được trả về giá trị text.lower() (Chuyển chữ cái in hoa thành in thường), còn nếu text nhận giá trị là 0 (Tức là minh đọc mà máy tính không hiểu) mà chưa đọc đến lần thứ 3 thì mình sẽ yêu cầu người sử dụng đọc lại. Nếu sau 3 lần mà máy tính vẫn không hiểu thì mình nói gì hay không nghe thấy gì thì mình sẽ cho dừng lại sử dụng hàm stop và hàm get_text lúc này sẽ được trả về giá trị là 0 (Mục đích là khi máy tính không nghe thấy gì thì mình sẽ cho dừng chương trình luôn).

Mình thêm câu lệnh time.sleep(2) mục đích là chương trình tạm dừng 2 giây để tránh máy tính đọc các đoạn văn bản bị khớp nhau.

5. Chức năng giao tiếp, chào hỏi

def hello(name): day_time = int(strftime('%H')) if day_time < 12: speak("Chào buổi sáng bạn {}. Chúc bạn một ngày tốt lành.".format(name)) elif 12 <= day_time < 18: speak("Chào buổi chiều bạn {}. Bạn đã dự định gì cho chiều nay chưa.".format(name)) else: speak("Chào buổi tối bạn {}. Bạn đã ăn tối chưa nhỉ.".format(name))

Nội dung chức năng này là để giao tiếp thông thường giữa người và máy tính. Đơn cử như: chào hỏi, hỏi thăm sức khỏe hay nói về thông tin trợ lý ảo,… Ở đây, mình sẽ mô phỏng bằng chức năng chào hỏi sử dụng hàm hello.

Mình sử dụng biến day_time để lưu giờ hiện tại trong ngày. Sau đó, biến sẽ được so sánh với các mốc giờ trong ngày để đưa ra lời chào.

Như trên thì trước 12 giờ thì mình sẽ chào buổi sáng, từ 12 giờ đến sau 18 giờ mình sẽ chào buổi chiều, từ 18 giờ trở đi mình sẽ chào buổi tối.

6. Chức năng hiển thị thời gian

def get_time(text): now = datetime.datetime.now() if "giờ" in text: speak('Bây giờ là %d giờ %d phút' % (now.hour, now.minute)) elif "ngày" in text: speak("Hôm nay là ngày %d tháng %d năm %d" % (now.day, now.month, now.year)) else: speak("Bot chưa hiểu ý của bạn. Bạn nói lại được không?")

Chức năng này khá là đơn giản. Mình sử dụng thư viện datetime để lưu thông tin thời gian tại thời điểm hiện tại trong ngày rồi lưu vào biến now

Mình kiểm tra nếu trong đoạn text mình hỏi có chữ "giờ", mình sẽ đọc thời gian hiện tại trong ngày còn nếu có chữ "ngày" trong text thì mình sẽ đọc thời điểm hiện tại trong năm.

Ví dụ:

text = "Bây giờ là mấy giờ"

Tức là có chữ "giờ" trong text thì hàm get_time thực hiện lệnh đọc:

Bây giờ là 10 giờ 26 phút

7. Chức năng mở ứng dụng hệ thống, website và chức năng tìm kiếm từ khóa trên Google

def open_application(text): if "google" in text: speak("Mở Google Chrome") os.startfile('C:Program Files (x86)GoogleChromeApplicationchrome.exe') elif "word" in text: speak("Mở Microsoft Word") os.startfile('C:Program FilesMicrosoft OfficerootOffice16WINWORD.EXE') elif "excel" in text: speak("Mở Microsoft Excel") os.startfile('C:Program FilesMicrosoft OfficerootOffice16EXCEL.EXE') else: speak("Ứng dụng chưa được cài đặt. Bạn hãy thử lại!")

Khi xuất hiện các từ khóa đặc biệt như google hay word hay excel trong text thì mình dùng hàm os.startfile() để mở các file ứng dụng từ hệ thống.

Chỉ kiểm tra từ google hay word hay excel trong text là chưa đủ. Mình cần giới hạn ngữ nghĩa của text ở trong hàm assistant để bot có thể hiểu là mở chương trình Google Chrome, Word, Excel chứ không nhầm lẫn với các chức năng khác.

def open_website(text): reg_ex = re.search('mở (.+)', text) if reg_ex: domain = reg_ex.group(1) url = 'https://www.' + domain webbrowser.open(url) speak("Trang web bạn yêu cầu đã được mở.") return True else: return False

Mình sử dụng hàm re.search() (Hàm tìm kiếm trong biểu thức chính quy Regular Expression) để tách phần domain sau chữ "mở" trong text rồi ghép với phần tiền tố "https://www." để tạo thành đường dẫn url của web.

Sau đó, mình sử dụng webbroser.open(url) để mở trang web mình yêu cầu.

Nếu domain được hàm re.search() tìm thấy thì mình sẽ thực hiện chức năng mở website và hàm open_website được trả về giá trị là True, còn nếu domain không được tìm thấy thì mình sẽ không thực hiện chức năng gì cả và hàm open_website trả về giá trị là False.

def open_google_and_search(text): search_for = text.split("kiếm", 1)[1] speak('Okay!') driver = webdriver.Chrome(path) driver.get("http://www.google.com") que = driver.find_element_by_xpath("//input[@name='q']") que.send_keys(str(search_for)) que.send_keys(Keys.RETURN)

Cuối cùng là chức năng tìm kiếm từ khóa trên Google. Mình tiếp tục thực hiện tách từ khóa phía sau chữ "kiếm" trong text sử dụng hàm split() rồi lưu vào biến search_for.

Tiếp theo mình gọi hàm webdriver.Chrome(path) để mở ứng dụng Google Chrome rồi vào trang chủ "https://www.google.com".

Sau đó, mình sử dụng hàm driver.find_element_by_path() để lấy thẻ query (viết tắt là q) rồi lưu vào biến que

Biến que thực hiện tìm kiếm từ khóa search_for và trả về kết quả trên Google Search.

8. Chức năng gửi Email

SMTP là 3 chữ cái đầu viết tắt của Simple Mail Transfer Protocol dịch ra có nghĩa là giao thức truyền tải thư tín đơn giản hóa. Và giao thức này thực hiện nhiệm vụ chính là gửi mail còn việc nhận mail hay truy xuất dữ liệu mail server sẽ có giao thức IMAP hay POP3 đảm nhiệm.

SMTP Server (server dùng để gửi mail) là một dịch vụ cho phép gửi email với số lượng lớn, tốc độ nhanh mà không bị giới hạn như các hòm mail miễn phí của Gmail hoặc mail đi kèm hosting. Nói cách khác các máy chỉ chủ giúp bạn thao tác gửi thư người ta thường gọi là SMTP server chúng thực hiện gửi thư qua giao thức TCP hoặc IP.

def send_email(text): speak('Bạn gửi email cho ai nhỉ') recipient = get_text() if 'yến' in recipient: speak('Nội dung bạn muốn gửi là gì') content = get_text() mail = smtplib.SMTP('smtp.gmail.com', 587) mail.ehlo() mail.starttls() mail.login('[email protected]', 'hung23081997') mail.sendmail('[email protected]', '[email protected]', content.encode('utf-8')) mail.close() speak('Email của bạn vùa được gửi. Bạn check lại email nhé hihi.') else: speak('Bot không hiểu bạn muốn gửi email cho ai. Bạn nói lại được không?')

Mình sử dụng thư viện smtplib để thực hiện chức năng gửi Email bằng phương thức smtp.

Mình lấy tên người gửi sử dụng bằng hàm get_text() rồi lưu vào biến recipient.

Ở hàm này, mình lấy ví dụ đơn giản là nếu tìm thấy chữ "yến" trong tên người cần gửi (recipient) thì mình sẽ thực hiện chức năng gửi Email.

Tiếp tục, mình gọi hàm get_text() để lấy nội dung cần gửi rồi lưu vào biến content.

Khá là đơn giản phải không!!!

9. Chức năng xem dự báo thời tiết

OpenWeatherMap là một dịch vụ trực tuyến cung cấp dữ liệu thời tiết. Nó thuộc sở hữu của OpenWeather Ltd, có trụ sở tại London, Vương quốc Anh. Nó cung cấp dữ liệu thời tiết hiện tại, dự báo và dữ liệu lịch sử cho hơn 2 triệu khách hàng, bao gồm các công ty Fortune 500 và hàng ngàn doanh nghiệp khác trên toàn cầu.

def current_weather(): speak("Bạn muốn xem thời tiết ở đâu ạ.") ow_url = "http://api.openweathermap.org/data/2.5/weather?" city = get_text() if not city: pass api_key = "fe8d8c65cf345889139d8e545f57819a" call_url = ow_url + "appid=" + api_key + "&q=" + city + "&units=metric" response = requests.get(call_url) data = response.json() if data["cod"] != "404": city_res = data["main"] current_temperature = city_res["temp"] current_pressure = city_res["pressure"] current_humidity = city_res["humidity"] suntime = data["sys"] sunrise = datetime.datetime.fromtimestamp(suntime["sunrise"]) sunset = datetime.datetime.fromtimestamp(suntime["sunset"]) wthr = data["weather"] weather_description = wthr[0]["description"] now = datetime.datetime.now() content = """ Hôm nay là ngày {day} tháng {month} năm {year} Mặt trời mọc vào {hourrise} giờ {minrise} phút Mặt trời lặn vào {hourset} giờ {minset} phút Nhiệt độ trung bình là {temp} độ C Áp suất không khí là {pressure} héc tơ Pascal Độ ẩm là {humidity}% Trời hôm nay quang mây. Dự báo mưa rải rác ở một số nơi.""".format(day = now.day,month = now.month, year= now.year, hourrise = sunrise.hour, minrise = sunrise.minute, hourset = sunset.hour, minset = sunset.minute, temp = current_temperature, pressure = current_pressure, humidity = current_humidity) speak(content) time.sleep(20) else: speak("Không tìm thấy địa chỉ của bạn")

Mình sử dụng nguồn dữ liệu thời tiết của hầu hết các thành phố trên toàn thể thời cung cấp tại trang web openweathermap.org

Đầu tiên, mình sẽ sử dụng biến ow_url để lưu đường đẫn đến api của trang web openweathermap.org. Thông tin các thẻ để thực hiện request mình sẽ bổ sung sau.

Mình gọi hàm get_text() để lấy thông tin thành phố cần truy vấn thời tiết rồi lưu vào biến city.

Nếu máy tính không nghe được tên thành phố thì hàm sẽ pass (Bỏ qua hàm)

Tiếp theo là thực hiện kết nối với api trang web openweathermap.org. Ở bước này, mình phải đăng kí tài khoản mới ở đây và lấy api_key để có thể thực hiện thao tác truy vấn.

Biến call_url sẽ lưu đường dẫn đầy đủ để truy vấn bao gồm thông tin tên thành phố cityapi_key mình đã lấy ở trên.

Thư viện requests là một mô-đun Python mà bạn có thể sử dụng để gửi tất cả các loại yêu cầu HTTP. Mình gọi hàm requests.get(call_url) để lấy thông tin truy vấn được từ trang web rồi lưu vào biến response. response.json() sẽ chuyển dữ liệu thuần về kiểu dữ liệu json rồi lưu vào biến data.

Nếu data["cod"] không trả về 404 tức là requests không bị lỗi hay có nghĩa là thông tin tên thành phố city chuẩn xác (truy vấn được) thì mình sẽ thực hiện chức năng xem thời tiết.

Bạn nên tìm hiểu về kiểu dữ liệu json. Mình không đề cập ở đây. Từ dữ liệu kiểu json được lưu trong biến data mình sẽ lấy được thông tin thời tiết bao gồm temperature, pressure, humidity,..

Cuối cùng mình kết nối những thông tin trên với nhau rồi lưu vào biến content và thực hiện đọc content.

Tương tự như trên, câu lệnh time.sleep(20) yêu cầu chương trình tạm dừng 20 giây để có thời gian đọc xong content trên.

10. Chức năng phát nhạc trên Youtube

def play_song(): speak('Xin mời bạn chọn tên bài hát') mysong = get_text() while True: result = YoutubeSearch(mysong, max_results=10).to_dict() if result: break url = 'https://www.youtube.com' + result[0]['channel_link'] webbrowser.open(url) speak("Bài hát bạn yêu cầu đã được mở.")

Mình gọi hàm get_text() để lấy thông tin tên bài hát muốn phát rồi lưu vào biến mysong.

Mình gọi vòng While là vì mình thực hiện tìm kiếm sử dụng mạng Internet nên sẽ có lúc kết nối yếu không tìm thấy. Mình chạy While True khi nào tìm thấy thì thôi.

Biến url lưu đường dẫn đến kết quả đầu tiên khi tìm kiếm trên Youtube.

Mình sẽ dùng hàm webbrowser.open(url) mở đường dẫn url đến video vừa được tìm kiếm trên Google Chrome để phát nhạc.

11. Chức năng thay đổi hình nền máy tính

Unsplash là một cộng đồng nhiếp ảnh – nơi mọi người chia sẻ miễn phí ảnh chụp chất lượng cao

def change_wallpaper(): api_key = 'RF3LyUUIyogjCpQwlf-zjzCf1JdvRwb--SLV6iCzOxw' url = 'https://api.unsplash.com/photos/random?client_id=' +  api_key # pic from unspalsh.com f = urllib2.urlopen(url) json_string = f.read() f.close() parsed_json = json.loads(json_string) photo = parsed_json['urls']['full'] # Location where we download the image to. urllib2.urlretrieve(photo, "C:/Users/Night Fury/Downloads/a.png") image=os.path.join("C:/Users/Night Fury/Downloads/a.png") ctypes.windll.user32.SystemParametersInfoW(20,0,image,3) speak('Hình nền máy tính vừa được thay đổi')

Tương tự như khi lấy thông tin dự báo thời tiết. Mình sẽ lấy nguồn dữ liệu kho ảnh của trang web unsplash.com.

Mình cần đăng ký để có api_key do trang web cung cấp để có thể kết nối với api của unsplash.com.

Biến url lưu đường dẫn đến api của trang unsplash.com.

Mình mở đường dẫn url và lấy requests rồi lưu thông tin vào biến json_string.

Bức ảnh sẽ được load và đọc từ json_string rồi lưu vào biến photo.

Dữ liệu hình ảnh photo được lưu lại thành file ảnh trong máy tính.

Cuối cùng, mình dùng lệnh thay đổi hình nền của hệ thống qua hàm số ctypes.windll.user32.SystemParametersInfoW().

Chỉ cần như vậy, máy tính đã được thay hình nền mới.

12. Chức năng đọc báo ngày hôm nay

News API là một API REST HTTP đơn giản sử dụng để tìm kiếm và truy xuất các bài viết trực tiếp từ khắp nơi trên web

def read_news(): speak("Bạn muốn đọc báo về gì") queue = get_text() params = { 'apiKey': '30d02d187f7140faacf9ccd27a1441ad', "q": queue, } api_result = requests.get('http://newsapi.org/v2/top-headlines?', params) api_response = api_result.json() print("Tin tức") for number, result in enumerate(api_response['articles'], start=1): print(f"""Tin {number}:nTiêu đề: {result['title']}nTrích dẫn: {result['description']}nLink: {result['url']} """) if number <= 3: webbrowser.open(result['url'])

Cách thực hiện tương tự như với chức năng dự báo thời tiết hay thay đổi hình nền máy tính.

Mình chọn trang web newsapi.org là nguồn các bài báo được cập nhật nhanh nhất và cho mình thông tin requests tốt nhất.

Ở đây, mình cũng phải đăng kí tài khoản và lấy apiKey trang web cung cấp để kết nối với nguồn dữ liệu của họ.

Mình sử dụng hàm get_text() để lấy thông tin về chủ đề mình muốn đọc.

Sau đó, mình gọi hàm requests.get() để khai thác thông tin từ đường dẫn url mình nhập và lưu vào biến api_result.

Kết quả được định dạng lại kiểu dữ liệu json và lưu vào biến api_response.

Cuối cùng, mình hiển thị tối đa 20 tin tức thu thập được và mở 3 đường dẫn đến 3 bài báo đầu tiên để tiện theo dõi. 

13. Chức năng tìm định nghĩa trên từ điển wikipedia

Wikipedia là một bách khoa toàn thư mở với mục đích chính là cho phép mọi người đều có thể viết bài bằng nhiều loại ngôn ngữ trên Internet. Wikipedia đang là công trình tham khảo viết chung lớn nhất và phổ biến nhất trên Internet và hiện tại được xếp hạng trang web phổ biến thứ 5 trên toàn cầu. Wikipedia thuộc về tổ chức phi lợi nhuận Wikimedia Foundation.

def tell_me_about(): try: speak("Bạn muốn nghe về gì ạ") text = get_text() contents = wikipedia.summary(text).split('n') speak(contents[0]) time.sleep(10) for content in contents[1:]: speak("Bạn muốn nghe thêm không") ans = get_text() if "có" not in ans: break speak(content) time.sleep(10) speak('Cảm ơn bạn đã lắng nghe!!!') except: speak("Bot không định nghĩa được thuật ngữ của bạn. Xin mời bạn nói lại")

Bot của mình có thể lấy thông tin chi tiết của hầu hết mọi thứ mình hỏi cô ấy. Như “Alex cho tôi biết về Google” hoặc “Vui lòng cho tôi biết về Siêu máy tính” hoặc “hãy cho tôi biết về Internet”. Vì vậy, như bạn có thể thấy, mình có thể hỏi về hầu hết mọi thứ.

Hàm tìm kiếm của thư viện wikipedia sẽ tìm kiếm chủ đề mình yêu cầu và trích xuất 500 ký tự đầu tiên (nếu bạn không chỉ định giới hạn, bot sẽ đọc toàn bộ trang cho bạn). Wikipedia là một thư viện Python giúp dễ dàng truy cập và phân tích dữ liệu từ Wikipedia.

Đầu tiên mình sử dụng hàm get_text() để lấy thông tin về thứ mình muốn định nghĩa rồi lưu vào biến text.

Sau đó, mình gọi hàm wikipedia.summary(text).split('n') để lưu lại thành một list các đoạn nội dung mà wikipedia tìm kiếm được.

Tiếp theo, mình đọc đoạn định nghĩa đầu tiên.

Nếu có yêu cầu đọc thêm các nội dung sau thì mình phải yêu cầu là "có" còn nếu không yêu cầu thì trợ lý ảo sẽ dừng đọc nội dung trong phần contents

14. Chức năng hiển thị các khả năng của trợ lý ảo

def help_me(): speak("""Bot có thể giúp bạn thực hiện các câu lệnh sau đây: 1. Chào hỏi 2. Hiển thị giờ 3. Mở website, application 4. Tìm kiếm trên Google 5. Gửi email 6. Dự báo thời tiết 7. Mở video nhạc 8. Thay đổi hình nền máy tính 9. Đọc báo hôm nay 10. Kể bạn biết về thế giới """)

Hàm đọc lại 10 chức năng mà trợ lý ảo có thể thực hiện được phòng khi người sử dụng chưa biết công dụng của trợ lý ảo.

15. Kết hợp tất cả chức năng Trợ lý ảo Tiếng Việt 

def assistant(): speak("Xin chào, bạn tên là gì nhỉ?") name = get_text() if name: speak("Chào bạn {}".format(name)) speak("Bạn cần Bot Alex có thể giúp gì ạ?") while True: text = get_text() if not text: break elif "dừng" in text or "tạm biệt" in text or "chào robot" in text or "ngủ thôi" in text: stop() break elif "có thể làm gì" in text: help_me() elif "chào trợ lý ảo" in text: hello(name) elif "hiện tại" in text: get_time(text) elif "mở" in text: if 'mở google và tìm kiếm' in text: open_google_and_search(text) elif "." in text: open_website(text) else: open_application(text) elif "email" in text or "mail" in text or "gmail" in text: send_email(text) elif "thời tiết" in text: current_weather() elif "chơi nhạc" in text: play_song() elif "hình nền" in text: change_wallpaper() elif "đọc báo" in text: read_news() elif "định nghĩa" in text: tell_me_about() else: speak("Bạn cần Bot giúp gì ạ?")

Chức năng cuối cùng là kết hợp các chức năng trên lại thành một con trợ lý ảo tiếng việt bằng phương pháp sử dụng các câu lệnh if... elif... else.

Mình sử dụng vòng lặp While True nhằm mục đích cho trợ lý ảo chạy vô hạn để trả lời liên tục các câu hỏi.

Mình gọi hàm get_text() để lấy thông tin về yêu cầu của mình rồi lưu vào biến text.

Nếu text nhận giá trị là 0 tức là máy tính không nghe thấy gì thì vòng lặp sẽ gặp lệnh break và dừng lại.

Còn nếu text là một yêu cầu của người dùng thì mình chia nhỏ ra các trường hợp để thực hiện tất cả các chức năng mình vừa cài đặt ở trên.

Nếu trợ lý ảo nghe thấy "dừng lại" hay "tạm biệt", … thì chương trình cũng tự động dừng lại.

Ví dụ, trợ lý ảo của mình nghe được yêu cầu

text = "mở google và tìm kiếm một quả táo"

Thì hàm open_google_and_search(text) sẽ được gọi với yêu cầu text để thực hiện chức năng mình yêu cầu. Trong trường hợp này, trợ lý ảo sẽ thực hiện mở ứng dụng Google Chrome rồi vào trang chủ www.google.com và nhập từ khóa “một quả táo” sau đó sẽ trả về các kết quả mà google tìm kiếm được.

Các chức năng còn lại hoạt động một cách tương tự.

Trên đây là toàn bộ nội dung mà mình thực hiện để hoàn thiện một trợ lý ảo tiếng việt. 

Vậy là mình đã thực hiện xong trợ lý ảo tiếng việt chỉ bằng những dòng code Python đơn giản, có thể nói tự mình tạo ra một trợ lý ảo máy tính để bàn hay laptop rất thú vị. Ngoài những tính năng trên, bạn cũng có thể tích hợp thêm nhiều tính năng khác nhau trong trợ lý giọng nói của mình.

Lưu ý: Khi bắt đầu thực hiện chương trình của mình, hãy nói to và rõ ràng để trợ lý ảo tương tác với bạn tốt hơn, nhiều khi trợ lý của bạn không hiểu bạn lắm đâu.

Demo

Source code

Bạn có thể tham khảo Full code của mình ở đây.

Hướng đến tương lai

Trong suốt chiều dài lịch sử phát triển máy tính, giao diện người dùng (User Interface) đang dần trở nên tự nhiên dễ sử dụng hơn. Đầu tiên đó là sự kết hợp của màn hình và bàn phím. Sau đó là chuột và đồ họa giao diện người dùng. Màn hình cảm ứng là bước phát triển vĩ đại trong cuộc cách mạng cải tiến máy tính. Chúng ta dự đoán bước tiếp theo sẽ có thể bao gồm sự kết hợp giữa thực tế ảo, hành vi con người và ra lệnh bằng giọng nói. Rốt cuộc thì việc giao tiếp luôn luôn là dễ dàng và hiệu quả để truyền đạt nội dung hơn là nhập tay một câu lệnh hay biểu mẫu nào đấy.

Càng nhiều người tương tác với các thiết bị kích hoạt bằng giọng nói thì hệ thống càng có nhiều dữ liệu về đặc điểm ngôn ngữ của người dùng. Hệ thống sẽ xác định được xu hướng và mô hình hóa thông tin nhận được. Sau đó, dữ liệu này có thể được sử dụng để xác định sở thích và thị hiều người dùng, đây là một trong những kế hoạch dài hạn để biến ngôi nhà trở nên thông minh hơn. Google và Amazon đang tìm cách tích hợp trí tuệ nhân tạo hỗ trợ giọng nói có khả năng phân tích và phản hồi lại cảm xúc của con người.

Mình hy vọng các bạn đã thích đọc bài viết này. Hãy chia sẻ suy nghĩ, nhận xét của bạn trong phần bình luận.


— Cập nhật: 11-01-2023 — tungchinguyen.com tìm được thêm bài viết Google Assistant là gì? Tính năng và cách sử dụng Trợ lý ảo Google từ website lptech.asia cho từ khoá cách tạo trợ lý ảo.

Google Assistant là công cụ hữu ích này hoạt động dựa trên thiết lập Google AI. Trợ lý ảo của Google cho phép người dùng điều khiển các thiết bị ứng dụng thông minh với những tính năng ra lệnh bằng giọng nói. Hãy cùng LPTech tìm hiểu về tính năng cũng như cách sử dụng Trợ lý ảo Google, qua bài viết dưới đây .

Google Assistant là gì?

Google Assistant là trợ lý ảo được phát triển bởi Google với những tính năng tương tác trực tiếp với con người thông qua câu lệnh bằng giọng nói được sử dụng cho các thiết bị thông minh. Google Assistant cung cấp cho người dùng những tính năng điều khiển như trò chuyện, tìm kiếm thông tin, tin tức các tính năng trên các thiết bị một cách dễ dàng dựa vào những câu lệnh.

Google Assistant được coi là một tiện ích mở rộng của Google Now, được thiết kế cho cá nhân và mở rộng thêm những tính năng điều khiển bằng giọng nói trên thanh tìm kiếm của Google. Không giống với Google Now, trợ lý Google có thể tích hợp tạo gia các cuộc trò chuyện hai chiều tương tự của công cụ Microsoft. Google Assistant được ra mắt vào năm 2016 và chứng minh được những sự phát triển đáng kinh ngạc như một là phiên bản trợ lý tiên tiến và năng động nhất hiện nay.

Google Assistant là công cụ hoạt động dựa trên tính năng sử dụng bằng giọng nói của Google hỗ trợ kết hợp cùng những tiện ích thông minh như thực hiện yêu cầu tìm kiếm thông tin mà người dùng đưa ra như mở danh bạ, gọi điện, nhắn tin cho tên trong danh bạ, giải trí nghe nhạc…Ban đầu, nó sẽ thu thập thông tin những gì bạn quan tâm dựa vào đó để có thể cung cấp cho người dùng những thông tin quan trọng.

Những tính năng nổi bật của Google Assistant

Nếu Google Now được biết đến với các tính năng cho phép người dùng thực hiện các lệnh bằng giọng còn Google Assistant kết hợp thêm với công nghệ AI giúp khả năng tương tác đàm thoại với người dùng trở nên tốt hơn. Dưới đây là những tính năng nổi bật của Trợ lý Google trên nền tảng Google:

Hỗ trợ tìm kiếm đường bằng khẩu lệnh Trợ lý ảo Google

Google Assistant sẽ hỗ trợ người dùng có thể dễ dàng xác định vị trí của mình khi lạc đường ở một địa điểm xa lạ, hay giúp bạn tìm kiếm một địa điểm ăn uống giải trí, vui chơi gần bạn nhất khi đi du lịch với một câu lệnh đơn giản: “Hey Google”, “Ok Google, tôi đang ở địa điểm nào?”, “Ok Google, nhà hàng nào gần vị trí tôi nhất?”.

Với câu lệnh “Hey Google”, người dùng có thể khởi động trợ lý ảo dễ dàng, nhận được nhiều câu hỏi và nhận về kết quả tương thích để tiết kiệm phần lớn thời gian. Trong quá trình di chuyển và tìm đường, người dùng được phép trao đổi trực tiếp với Google Assistant thông qua công cụ Google Map được tích hợp sẵn trên nền tảng của Google.

Hẹn giờ và gửi tin nhắn

Khi bạn đang làm việc mà muốn nghe các tin tức mới nhất, Google Assistant giúp bạn chỉ bằng câu lệnh: “OK Google, hãy đọc cho tôi nghe tin”. Thậm chí Google Assistant còn có thể trở thành một phiên dịch ở mọi lúc mọi nơi đồng hành cùng bạn và những chuyến du lịch nước ngoài. Cùng rất nhiều các tiện ích khác với trợ lý ảo được nâng cấp về AI giúp lưu trữ và rà soát dữ liệu thông tin chính xác trong thời gian ngắn, mang đến cho người dùng những trải nghiệm độc đáo.

Tính năng tìm kiếm giọng

Với thiết bị như trên smart tivi thì tính năng này đã khá quen thuộc với nhiều người, những mẫu tivi có hỗ trợ tính năng AI – trợ lý ảo thì việc tìm kiếm ngày càng thông minh hơn giúp người dùng có những gợi ý kết quả ra giống với ý của người tìm.

Google Assistant ngày càng được cải tiến thông minh hơn và thực hiện các nhiệm vụ thông qua tương tác 2 chiều với người dùng. Người dùng có thể đối thoại trực tiếp với các trợ lý ảo để đáp lại những yêu cầu, không còn là những câu lệnh đơn giản và nhàm chán.

Tính năng tự học

Google Assistant có thể tìm kiếm thông tin trên Internet với phần điều chỉnh cài đặt phần cứng trên thiết bị của bạn… Với assistant bạn có thể yêu cầu trợ lý truy cập bằng cách giao tiếp vào kho thông tin khổng lồ của nó đã thu thập để tìm ra thông tin phù hợp với bạn.

Google Assistant sẽ hoạt động dựa trên lịch sử tìm kiếm, thói quen sử dụng các nền tảng online, thói quen sử dụng thiết bị đã có liên kết với nhau. Google Assistant sẽ tự đưa ra các dự đoán và lọc thông tin phù hợp với sở thích của người dùng.

Điều khiển và hỗ trợ hầu hết các thiết bị

Google Assistant tính đến nay đã được hỗ trợ ở gần như toàn bộ các thiết bị công nghệ thông minh. Công cụ này có thể kết nối với nhiều thiết bị trong nhà nhờ Google Assistant. Google Assistant cho phép kết nối với tivi liên kết và nhiều thiết bị thông minh khác trong nhà như Robot hút bụi, đèn cảm ứng thông minh, máy lạnh, hay rèm cửa tự động,… từ đó người dùng có thể ra lệnh điều khiển cho các thiết bị một cách đơn giản.

VD: Bạn có một Robot hút bụi trong nhà được kết nối với một chiếc tivi có kết nối tính năng Google Assistant thì bạn chỉ cần sử dụng remote của tivi để điều khiến lệnh để robot tự động khởi động và hút bụi ở nhà.

Cách sử dụng công cụ Google Assistant hiệu quả

Công nghệ trí tuệ nhân tạo (Công nghệ AI) được tích hợp trong Google Assistant có thể tự động hóa giúp ích cho bạn rất nhiều việc trong cuộc sống xung quanh. Dưới đây là cách sử dụng công cụ trợ lý Google có thể thực hiện:

Sắp xếp công việc

Người dùng có thể tạo nhắc nhở hoặc lịch hẹn bằng Google Assistant để quản lý danh mục công việc hàng ngày trở nên dễ dàng. Để tạo lịch hẹn, người dùng phải kích hoạt trợ lý Google và nói cụm từ “Tạo lịch hẹn”. Nội dung lịch hẹn và giờ hẹn để thiết lập cài đặt đúng giờ hẹn, Google Assistant sẽ nhắc nhở hoặc có thông báo dành cho bạn. Để tạo nhắc nhở cho việc cần làm, bạn hãy thực hiện như sau:

  1. Bước 1: Hãy bật trợ lý Google và nói cụm từ “Tạo nhắc nhở“.
  2. Bước 2: Bạn hãy nói nội dung lời nhắc và thời gian cụ thể để thiết lập cài đặt. Ngoài ra, bạn cũng có thể tạo nhắc nhở theo bằng cách nhập trên bàn phím điện thoại mục Lời nhắc. Hãy điền đầy đủ Thời gian và Địa điểm rồi ấn Lưu để kết thúc đặt lời nhắc.

Tạo kế hoạch hàng ngày

Google Assistant cũng có thể hỗ trợ người dùng trong việc đặt ra kế hoạch hàng ngày để nhận được nhắc nhở, với các bước cài đặt như sau:

  1. Bước 1: Kích hoạt Google Assistant và nói cụm từ “Lên kế hoạch hàng ngày“, và chọn mục Quy trình.
  2. Bước 2: Tiếp đó chọn Ngày làm việc và gạt sang thanh trạng thái bên phải để bật quy trình và mục Nhận được thông báo trên điện thoại của bạn sẽ hiện ra khi quy trình bắt đầu. Bên cạnh đó, nếu muốn bạn cũng có thể tự cài đặt thêm nhiều tùy chọn cho kế hoạch Ngày làm việc.

Sử dụng cho việc giải trí

Trợ lý Google còn giúp người dùng giải trí, bạn muốn nghe nhạc hay xem phim nhanh chóng tchỉ cần bật trợ lý Google và nói tên ứng dụng muốn tìm như YouTube, Spotify, Netflix,…. Ngay lập tức, ứng dụng sẽ tự động được bật để bạn trải nghiệm.

Tìm kiếm thông tin thắc mắc

Google Assistant sẽ hỗ trợ bạn trong việc tìm kiếm thông tin và giải đáp thắc mắc mà bạn đang tìm kiếm một cách dễ dàng. Bạn chỉ cần bật trợ lý Google và nói tên nội dung thông tin bạn muốn tìm kiếm, ngay lập tức công cụ thông minh này sẽ giúp bạn tìm kiếm trên nền tảng Google. Ví dụ, bạn muốn biết về Vinfast, thì chỉ cần nói cụm từ “Hãng xe Vinfast” với trợ lý Google.

Sử dụng để gọi điện thoại và gửi tin nhắn

Bạn có thể dễ dàng gọi điện và gửi tin nhắn mà không cần tìm số trong danh bạ với trợ lý Google, bạn có thể thực hiện tương tự các bước làm như cách gọi điện:

  1. Bước 1: Bật trợ lý Google và nói cụm từ “Gọi điện” hay nói cụm từ “Gửi tin nhắn“.
  2. Bước 2: Tiếp tục nói tên danh bạ hoặc số điện thoại và bạn muốn gọi điện hay nhắn tin kèm nội dung tin nhắn bạn muốn gửi Trợ lý Google sẽ lập tức kết nối cuộc gọi và gửi tin nhắn giúp cho bạn. Ngoài ra, bạn cũng có thể thực hiện bằng cách thủ công bằng cách ấn vào Mục liên hệ và chọn danh bạ bạn muốn gọi điện hay gửi tin nhắn.

Ghi lại khoảnh khắc đáng nhớ

Google Assistant có thể giúp bạn trong việc lưu lại những khoảnh khắc đáng nhớ một cách nhanh chóng, thay vì mất thời gian tìm và bật ứng dụng Camera. Bạn chỉ cần bật trợ lý Google và nói cụm từ “Chụp ảnh”. Ứng dụng Camera sẽ được tự động bật lên phục vụ nhu cầu của bạn.

Sử dụng những tính năng khác

Google Assistant còn có tích hợp nhiều tính năng độc đáo hỗ trợ người dùng khác, để có thể sử dụng các tính năng này, bạn hãy làm theo sau:

  1. Bước 1: Vào phần Cài đặt trên điện thoại của bạn, tiếp đó chọn Google.
  2. Bước 2: Chọn Chế độ cài đặt cho các ứng dụng Google, giao diện hiện ra Chọn Tìm kiếm, Trợ lý và Voice.
  3. Bước 3: Chọn Trợ lý Google và tiếp đó rất nhiều tính năng thú vị như Đặt chỗ, Giao thông, Giao dịch mua,… hãy ấn chọn vào tính năng mà bạn muốn để tìm hiểu và trải nghiệm.

Những thiết bị nào hỗ trợ Google Assistant

Google cho phép bên thứ ba – các thiết bị thông minh bổ sung thêm các tính năng vào Google Assistant hỗ trợ, dưới đây là một số thiết bị phổ biến:

  • Đối với thiết bị điện thoại: Các sản phẩm Android (phiên bản Android 5.0) trở lên sẽ được tích hợp sẵn trong ứng dụng Google, và trên iPhone thiết bị iOS 11 trở lên thì Google Assistant hỗ trợ dung lượng trong khoảng 200MB.
  • Đối với các thiết bị khác: Các thiết bị như TV, loa thông minh,…Google Assistant cũng có hỗ trợ trên các thiết bị thông minh.

Cách thức hoạt động của Trợ lý ảo Google

Google Assistant hoạt động chính bằng cách tương tác trực tiếp với lệnh bằng giọng nói hay nhập văn bản yêu cầu. Ngoài ra, người dùng có thể kích hoạt thay thế vị trí của tính năng tìm kiếm nhanh trên Google từ màn hình chính. Điểm khởi đầu cho Assistant, sau đó người dùng có thể nhập hoặc đặt các câu hỏi, trợ lý ảo sẽ dựa theo các cuộc trò chuyện để xác định ngữ cảnh và đưa ra phản hồi kết quả bằng các thông tin nhanh nhất.

Google Assistant có thể học theo, nắm bắt thói quen, sở thích của người dùng và ghi nhớ toàn bộ những thông tin khi bạn đã từng tìm kiếm. Trong khi đó, Google Now chỉ biết nghe và thực hiện mệnh lệnh, trên các thiết bị đã cập nhật Marshmallow hoặc Nougat, nhấn giữ Home là có thể khởi chạy Assistant.

Thiết lập Google Assistant

Thiết lập Assistant trên điện thoại của người dùng nếu đang chạy bất kỳ phiên bản của Android từ Marshmallow (6.0) trở lên, hãy nhấn và giữ nút Home để mở Google Assistant (hoặc nếu kích hoạt bằng giọng nói đã được bật và nói “OK Google”. Nếu người dùng chưa có Google Assistant, một bản cập nhật sẽ thông báo gửi đến với bạn.

  1. Bước 1: Để thiết lập Google Assistant bằng cách nhấn và giữ nút Home.
  2. Bước 2: Trên giao diện “Meet your Google Assistant“, chọn vào Continue cho phép Google Assistant nhập thông tin cần thiết để thiết lập hoạt động nhấn “Yes, I’m in“.
  3. Bước 3: Để trợ lý ảo Assistant này bắt đầu làm quen và nhận dạng được giọng nói người dùng chọn Get started.

Cách tùy chỉnh Trợ lý Google

  1. Chọn tài khoản Google: Người dùng đảm bảo rằng đã chọn tài khoản Google thuộc sở hữu của chính mình, trong trường hợp nếu bạn có nhiều tài khoản nên chọn tài khoản mà bạn thường dùng. Chạm vào biểu tượng khởi động Google Assistant, ở menu ba chấm ở trên cùng bên phải chọn mở menu và nhấn tài khoản, tiếp đó chọn tính năng mà bạn muốn sử dụng.
  2. Truy cập cài đặt: Khởi động công cụ Google Assistant, chọn biểu tượng menu ba chấm ở trên cùng bên phải để mở menu rồi nhấn Settings. Sau đó, bạn sẽ thấy một giao diện bao gồm danh sách các cài đặt cho Home control, News, My Day hoặc Shopping list.
  3. Thiết lập các nguồn tin tức ưa thích: Hãy truy cập Settings, nhấn chọn News, sau đó chọn Customize, chọn tất cả các nguồn tin tức bạn muốn rồi nhấn vào mũi tên quay lại. Sau đó, bạn một danh sách các nguồn tin tức sẽ hiện ra, bạn có thể kéo xung quanh để cài đặt dựa trên mức độ ưu tiên. Để nghe tin tức mà bạn đã tùy chỉnh chỉ cần nói “Listen to the news“.
  4. Thiết lập tổng quan My day: Để thiết lập tính năng này bạn cần chuyển đến menu Settings và nhấn chọn My Day. Lựa chọn những gì bạn muốn là phần tổng quan hàng ngày của bạn bao gồm thời tiết, công việc cần làm, cuộc họp tiếp theo, lời nhắc và tin tức. Khi bạn muốn Google Assistant cho bạn biết những công việc, tin tức trong chương trình của bạn trong ngày, bạn chỉ cần nói “Tell me about my day“.

Sự khác biệt giữa Google Assistant và trợ lý ảo Siri

Ngay khi ra mắt, Google Assistant được đông đảo người dùng đón nhận, sử dụng và đánh giá cao vì những ưu điểm mà trợ lý ảo này mang lại. Trợ lý ảo Assistant của Google hiện đã hỗ trợ trên hệ điều hành Android và cả hệ điều hành iOS, tuy nhiên liệu trợ lý ảo này có xứng đáng thay thế Siri hay không trên IOS không? Đáp án cho câu trả lời này là có, dưới đây là sự khác biệt giữa Google Assistant và trợ lý ảo Siri, giúp bạn có được cái nhìn tổng quát hơn.

Khi sử dụng trợ lý ảo Google Assistant trên iOS, người dùng cần lưu ý công cụ này chỉ mới hỗ trợ tại thị trường Mỹ, trong khi tại các quốc gia khác thì chưa được hỗ trợ. Hai trợ lý ảo này có cách khởi chạy thể hiện sự khác biệt. Khác với Siri được tích hợp sẵn trong hệ điều hành iOS thì Assistant lại hoạt động độc lập như một ứng dụng. Để khởi chạy công cụ Siri, người dùng chỉ cần việc nhấn giữ nút Home trên iPhone, hoặc iPad, còn để khởi chạy trở lý Assistant thì bạn cần thao tác phải mở ứng dụng không thể dùng phím tắt hay ra lệnh giọng nói như trên hệ điều hành Android.

Google Assistant mặc định khi ra lệnh gửi email hay tìm kiếm bản đồ sẽ tự động chạy những ứng dụng của Google như Gmail hay Google Maps. Trong khi trợ lý ảo Siri có thể thực hiện những công việc nói trên với các ứng dụng của Apple, đồng thời bạn có thể ra lệnh cho Siri mở các ứng dụng của bên thứ 3 như Gmail, Google Maps,… một cách bình thường.

So với Siri, công cụ Google Assistant tỏ ra có phần vượt trội ở khả năng thực hiện nhanh qua một chức năng, thao tác thông qua phím tắt được thiết lập trong phần cài đặt, chẳng hạn ví dụ bạn có thể nói “I’m coming there” cho trợ lý ảo Google để soạn nhanh một đoạn tin nhắn cho một người nào đó rằng bạn đang đến. Trong khi với Siri, người dùng chỉ có thể ra lệnh bằng thao tác cụ thể chứ không thể sử dụng phím tắt để thực hiện nhanh một thao tác bất kỳ nào đó.

Tổng kết

Google Assistant là công cụ hỗ trợ vô cùng hữu ích, với những tính năng được tích hợp ưu việt giúp người dùng sử dụng những thiết bị trở nên dễ dàng và tiện lợi hơn. Vì vậy, nếu chưa cài đặt Google Assistant, hay mau thiết lập và dùng thử ứng dụng này ngay. Hy vọng qua bài viết dưới đây sẽ giúp bạn giải đáp Google Assistant là gì, tính năng và cách sử dụng trợ lý ảo này sao cho hiệu quả nhằm nâng cấp và tối ưu giúp người dùng có được trải nghiệm ổn định và tinh tế nhất.

Thông tin liên hệ

Nếu bạn có thắc mắc gì, có thể gửi yêu cầu cho chúng tôi, và chúng tôi sẽ liên lạc lại với bạn sớm nhất có thể .

Công ty TNHH TMĐT Công nghệ LP

Giấy phép kinh doanh số 0315561312/GP bởi Sở Kế Hoạch và Đầu Tư TP. Hồ Chí Minh.

Văn phòng: Lầu 6, Toà nhà Hoàng Minh, 100 Nguyễn xí, Phường 26, Quận Bình Thạnh, HCMC

Mail: sales@lptech.asia

Zalo OA:LP Tech Zalo Official

Zalo Sales:0866 974 944 (Sales)