Cách tổ chức kiến thức và dự án cá nhân hiệu quả với ứng dụng Obsidian
Máy Tính

Khám Phá Sức Mạnh của Obsidian với Whisper Plugin: Chuyển Đổi Giọng Nói Thành Văn Bản Tự Động Hiệu Quả

Sau khi được truyền cảm hứng từ các đồng nghiệp XDA, tôi đã biến Obsidian thành ứng dụng ghi chú chính trên máy tính của mình. Tôi sử dụng nó để ghi lại mọi suy nghĩ, ý tưởng, liên kết, hình ảnh và những mẩu thông tin quan trọng khác. Tuy nhiên, việc gõ những ghi chú dài đôi khi khá mệt mỏi, và tôi luôn mong muốn Obsidian có một tính năng tích hợp để chuyển đổi ghi chú giọng nói thành văn bản. Trước đây, tôi đã thử ứng dụng Ghi chú của Apple để ghi âm và chép lại giọng nói, nhưng trải nghiệm không mấy ấn tượng. Mọi thứ đã thay đổi hoàn toàn khi tôi khám phá ra plugin Whisper dành cho Obsidian. Kể từ khi bắt đầu sử dụng, plugin này đã thực sự thay đổi cách tôi làm việc. Tôi tích cực sử dụng nó để ghi chú bằng giọng nói mà không cần bận tâm về việc khi nào hoặc làm thế nào tôi sẽ chép lại tất cả.

Plugin Whisper đã giúp tôi biến Obsidian thành một giải pháp ghi chú mạnh mẽ đúng nghĩa. Nó thay đổi quy trình làm việc của tôi theo cách tôi không ngờ tới, và tổng thể trải nghiệm sử dụng Obsidian của tôi trở nên bổ ích hơn rất nhiều. Nhờ đó, tôi duy trì nhật ký cá nhân thường xuyên bằng cách ghi lại các ghi chú âm thanh nhanh chóng mọi lúc mọi nơi. Ngoài ra, việc tìm kiếm văn bản liên quan trong “biển” ghi chú trở nên tức thì, nhờ vào các bản chép được cung cấp bởi plugin. Mặc dù tham gia muộn, tôi hối tiếc vì đã không sử dụng nó sớm hơn.

Cách tổ chức kiến thức và dự án cá nhân hiệu quả với ứng dụng ObsidianCách tổ chức kiến thức và dự án cá nhân hiệu quả với ứng dụng Obsidian

Whisper Plugin: Bước Đột Phá trong Chuyển Đổi Giọng Nói Thành Văn Bản Tự Động cho Obsidian

Trải nghiệm như một trợ lý giọng nói lý tưởng

Tôi từng nghĩ ứng dụng Ghi chú là đủ để chuyển đổi ghi chú giọng nói một cách dễ dàng, nhưng tôi đã hoàn toàn sai lầm. Plugin Whisper, dù không phải là một tính năng tích hợp sẵn, đã đủ sức thuyết phục tôi chuyển đổi hoàn toàn từ ứng dụng Ghi chú sang Obsidian. Whisper là hệ thống nhận dạng giọng nói tự động của OpenAI, có khả năng lắng nghe giọng nói và chuyển đổi thành văn bản viết. Để plugin hoạt động trơn tru, tôi đã nhập khóa API của OpenAI vào phần cài đặt của plugin.

Sau đó, tất cả những gì tôi cần là micro và bản thân để ghi chú giọng nói trực tiếp trong Obsidian. Khi tôi dừng ghi âm, Obsidian hiển thị một trình phát mini cho âm thanh dưới dạng một ghi chú mới, và bản chép sẽ tự động xuất hiện bên dưới dưới dạng văn bản. Sau nhiều lần thử nghiệm, tôi nhận thấy plugin sẽ chuyển đổi các ghi chú ngắn rất nhanh. Nhưng khi tôi cố gắng tải lên các tệp âm thanh hiện có, chẳng hạn như một tập podcast dài 25 phút, quá trình chuyển đổi giọng nói thành văn bản mất khá nhiều thời gian.

Plugin đã khiến tôi bất ngờ với khả năng chép lại cực kỳ chính xác, ngay cả khi cách phát âm của tôi đôi khi có sự khác biệt với một số từ nhất định. Plugin còn làm tôi kinh ngạc khi tôi cố gắng bắt chước một giọng điệu khác. Để kiểm tra thêm, tôi lấy cuốn sách học tiếng Pháp cũ ra và đọc to, và thậm chí cả những đoạn đó cũng được chép lại rất tốt, bất chấp trình độ tiếng Pháp còn “gỉ” của tôi. Tất nhiên, nó không thể xử lý những từ bị biến dạng do sử dụng micro tai nghe chất lượng kém.

Plugin này giúp tôi tập trung vào việc nói mà không có bất kỳ sự kìm kẹp nào khi ghi chú. Tôi luôn có thể xem lại và sửa các lỗi sai trong bản chép sau. Để làm được điều đó, tôi đã tạo các thư mục riêng để lưu trữ âm thanh và bản chép từ plugin. Theo mặc định, plugin sẽ lưu tất cả ghi chú giọng nói riêng biệt, vì vậy tôi cần di chuyển chúng vào thư mục ghi chú giọng nói chuyên dụng của mình. Đây là điều tôi hoàn toàn có thể chấp nhận.

Những Điều Cần Cân Nhắc Khi Sử Dụng Whisper Plugin: Chi Phí và Quyền Riêng Tư

Quyền riêng tư đi kèm chi phí

Việc thiết lập plugin Whisper trong Obsidian không tốn nhiều công sức. Tuy nhiên, bạn sẽ cần nạp một khoản tiền vào tài khoản OpenAI của mình vì gói miễn phí sẽ không hoạt động, và bạn cũng cần đăng ký làm nhà phát triển. Về chi phí, tôi ước tính sẽ mất khoảng 2 giờ 45 phút để tiêu hết 1 đô la khi sử dụng dịch vụ chuyển đổi âm thanh sang văn bản của Whisper thông qua API. Đáng tiếc, tôi phải trả tiền riêng cho dịch vụ này vì nó không được bao gồm trong tài khoản ChatGPT trả phí của tôi, và tôi bị tính phí theo mô hình trả tiền theo mức sử dụng.

Khi thấy thiết lập Obsidian với Whisper của tôi, một người bạn đã bình luận một cách ngẫu nhiên về việc để OpenAI nghe và xử lý tất cả suy nghĩ của tôi. Và bình luận đó đã đọng lại trong tôi. Khi tìm hiểu, tôi phát hiện ra rằng OpenAI cung cấp tùy chọn tắt tính năng ghi nhật ký dữ liệu (Data logging) từ cài đặt tài khoản, điều này sẽ giúp giải quyết các lo ngại về quyền riêng tư. Nếu không, dữ liệu âm thanh của tôi sẽ được lưu trữ trên máy chủ của OpenAI trong 30 ngày. Ít nhất đó là những gì OpenAI tuyên bố, bên cạnh việc không sử dụng dữ liệu đó để đào tạo mô hình. Tuy nhiên, tôi vẫn muốn tìm hiểu xem liệu tôi có thể chạy mô hình chuyển đổi giọng nói thành văn bản cục bộ trên máy tính của mình hay không.

Giao diện cài đặt và hoạt động của Whisper plugin trong ObsidianGiao diện cài đặt và hoạt động của Whisper plugin trong Obsidian

Khám Phá Giải Pháp Chạy Mô Hình Whisper Cục Bộ Trên Máy Tính Cá Nhân

Nỗ lực không hề nhỏ

Vì mô hình Whisper cốt lõi là mã nguồn mở, tôi đã tìm hiểu cách để làm cho nó hoạt động trên chiếc MacBook Air M1 cơ bản của tôi với 8GB RAM. Tôi tình cờ tìm thấy phiên bản C/C++ của mô hình Whisper (whisper.cpp), có thể chạy cục bộ trên máy tính ở chế độ offline. Sau khi clone kho lưu trữ và tải xuống một mô hình Whisper lớn đã được chuyển đổi sang định dạng nhị phân tùy chỉnh, tôi đã xây dựng ứng dụng Whisper.cpp.

Sử dụng một script shell, tôi đã chạy một máy chủ mô hình Whisper cục bộ để làm việc với plugin Whisper trong Obsidian và ghi lại một ghi chú giọng nói. Bản chép xuất hiện tự động cùng với ghi chú âm thanh bằng cách sử dụng phiên bản mô hình Whisper cục bộ. Sau khi thử nghiệm nhiều lần, tôi nhận ra rằng mô hình Whisper cục bộ còn kém về độ chính xác và đôi khi không nhận diện được giọng điệu. Tuy nhiên, tôi vẫn đạt được kết quả khá hài lòng với một vài bản chép giọng nói thành văn bản.

Nói để giải phóng bản thân khỏi việc gõ ghi chú

Gõ phím không phải là cách duy nhất để ghi chú trong Obsidian. Plugin Whisper làm cho ứng dụng này trở nên phù hợp với bất kỳ ai muốn thoát khỏi việc gõ bàn phím liên tục. Ngay cả khi bạn thích gõ, tôi cũng khuyến khích bạn ít nhất hãy thử plugin này. Plugin này là một ví dụ điển hình cho thấy cộng đồng Obsidian luôn năng động xây dựng nhiều tiện ích bổ sung để biến ứng dụng này thành lựa chọn yêu thích của nhiều người. Ngay cả khi mô hình Whisper cục bộ được hỗ trợ bởi các tệp nhị phân tùy chỉnh hoạt động tốt, tôi vẫn khuyên bạn nên sử dụng một máy tính mạnh mẽ với CPU khá và ít nhất 16GB RAM để đạt hiệu suất tối ưu.

Plugin Whisper đã giúp tôi tự tin hơn, nói ra những suy nghĩ và ý tưởng của mình một cách cởi mở bằng cách ghi âm chúng. Đó là lý do tại sao nó nhanh chóng trở thành ứng dụng ghi chú hàng đầu của tôi sau khi thử nhiều ứng dụng khác.

Logo chính thức của ứng dụng ghi chú mạnh mẽ ObsidianLogo chính thức của ứng dụng ghi chú mạnh mẽ Obsidian

Obsidian

Hãy tải xuống Obsidian ngay hôm nay để khám phá thêm tiềm năng của ứng dụng ghi chú độc đáo này và trải nghiệm khả năng biến hóa mạnh mẽ mà các plugin như Whisper mang lại.

Related posts

Obsidian: Bí Quyết Đắc Lực Giúp Dungeon Master “Cân” Mọi Chiến Dịch D&D

Administrator

Nvidia 576.02: Bản Cập Nhật Driver “Khổng Lồ” Khắc Phục Hàng Loạt Lỗi Nghiêm Trọng

Administrator

Màn hình Alienware AW2725DF: Đỉnh cao QD-OLED 360Hz cho Game thủ Việt

Administrator