Tạo một AI-Powered Data Analyst sử dụng n8n
Hãy tưởng tượng có một hệ thống AI có thể truy vấn một triệu hàng dữ liệu. Điều đó có ý nghĩa gì đối với doanh nghiệp của bạn? Trong bài viết này, chúng ta sẽ khám phá cách xây dựng một AI data analyst sử dụng n8n, một nền tảng no-code, để kết nối với bất kỳ cơ sở dữ liệu SQL nào và tạo ra thông tin chi tiết ngay lập tức.
Giới thiệu về Dự án
Dự án liên quan đến việc xây dựng một AI-powered data analyst sử dụng n8n, một nền tảng no-code, để kết nối với cơ sở dữ liệu BigQuery và xử lý hơn một triệu hàng dữ liệu từ một dataset Google Analytics. Mục tiêu là tạo ra một hệ thống có thể cung cấp thông tin chi tiết ngay lập tức từ dữ liệu bằng cách sử dụng các truy vấn ngôn ngữ tự nhiên.
Tổng quan về Dataset
Dataset được sử dụng cho dự án này là dataset mẫu Google Analytics trong BigQuery, chứa khoảng một triệu hàng dữ liệu lưu lượng truy cập từ một cửa hàng bán hàng hóa Google. Dữ liệu bao gồm thông tin về nguồn lưu lượng truy cập, dữ liệu nội dung và hành vi người dùng trên trang web.
Phân tích Hệ thống
Hệ thống bao gồm hai agent chính: main agent và database query tool. Main agent chịu trách nhiệm hiểu ý định của người dùng, phân tích truy vấn và xác định các bộ lọc và bảng để tập trung vào khi tạo truy vấn SQL. Database query tool, mặt khác, tạo ra truy vấn SQL tương đương và thực thi nó trên cơ sở dữ liệu BigQuery.
Demo và Kết quả
Hệ thống được trình diễn bằng cách đặt một số câu hỏi, bao gồm các câu hỏi thăm dò dữ liệu, chẳng hạn như tìm các điểm dữ liệu sớm nhất và muộn nhất trong dataset, và các câu hỏi phức tạp hơn, chẳng hạn như đếm tổng số phiên mỗi tháng và tìm năm hệ điều hành hàng đầu có lưu lượng truy cập lớn nhất.
Database Query Tool
Database query tool được sử dụng để chuyển đổi các truy vấn ngôn ngữ tự nhiên thành truy vấn SQL và thực thi chúng trên cơ sở dữ liệu BigQuery. Công cụ này sử dụng một mô hình ngôn ngữ đơn giản và nhanh chóng, chẳng hạn như mô hình GPT-3 Mini và được kết nối với Postgres chat memory để theo dõi ngữ cảnh.
Frontend và Logging
Hệ thống sử dụng ứng dụng Streamlit đơn giản làm frontend để giao tiếp với agent. Các log được theo dõi bằng cách sử dụng node Google Sheets, giúp dễ dàng giám sát agent và đảm bảo nó xuất ra các truy vấn SQL chính xác.
Kết quả và Thông tin chi tiết
Hệ thống có thể cung cấp thông tin chi tiết ngay lập tức từ dữ liệu, bao gồm các điểm dữ liệu sớm nhất và muộn nhất, tổng số phiên mỗi tháng và năm hệ điều hành hàng đầu có lưu lượng truy cập lớn nhất. Kết quả được trình bày ở định dạng thân thiện với người dùng, giúp dễ hiểu và phân tích dữ liệu.
Kết luận và Công việc Tương lai
Dự án chứng minh sức mạnh của việc xây dựng một AI-powered data analyst sử dụng n8n và BigQuery. Hệ thống có thể được phát triển hơn nữa bằng cách tự động hóa các biểu đồ từ các bảng và trực quan hóa dữ liệu một cách tự động. Các khả năng thực sự là vô tận và hệ thống có thể được sử dụng để cung cấp thông tin chi tiết ngay lập tức từ các dataset lớn bằng cách sử dụng các truy vấn ngôn ngữ tự nhiên.
Suy nghĩ cuối cùng
Dự án làm nổi bật tiềm năng của việc sử dụng các nền tảng no-code như n8n để xây dựng các hệ thống phức tạp có thể cung cấp thông tin chi tiết ngay lập tức từ các dataset lớn. Hệ thống có thể được sử dụng trong nhiều ngành công nghiệp khác nhau, bao gồm marketing, tài chính và hoạt động, để đưa ra các quyết định dựa trên dữ liệu.