Exploring 5 challenges for Claude computer use: Lessons learned

Trong một thí nghiệm thú vị về khả năng sử dụng máy tính của Claude AI, năm thách thức đã được đặt ra để thử nghiệm. Từ việc tự động hóa ý tưởng khởi nghiệp đến việc mở rộng giới hạn của các máy ảo, thí nghiệm đã tiết lộ cả khả năng lẫn giới hạn của AI khi tương tác với môi trường kỹ thuật số. Bài viết này đi sâu vào từng thách thức, khôi phục quy trình làm việc và kết quả một cách chi tiết.

Challenge 1: Generating income with a QR code entrepreneurial idea

Click to revisit the moment Claude starts generating QR codes

Objective

Mục tiêu là tạo ra một ý tưởng thực thi hoàn toàn để kiếm $1,000 theo cách sáng tạo nhất có thể. Nhiệm vụ này đặt ra những hạn chế đối với hành động của Claude, giới hạn các hành động của nó chỉ trong việc truy cập trình duyệt Firefox, các công cụ lập trình như Python và sáng tạo chung trong khi tránh đăng nhập vào các dịch vụ bên ngoài.

Execution

Claude đề xuất một ý tưởng xuất sắc: tạo ra các mã QR liên kết đến thực đơn nhà hàng. Bằng cách tự động hóa quy trình, các nhà hàng có thể tích hợp công nghệ vào trải nghiệm của khách hàng, và Claude có thể giúp người dùng tiếp thị các dịch vụ này đến các chủ doanh nghiệp nhỏ và vừa.

Sau khi nhận được ý tưởng này, AI đã bắt đầu thiết kế một tập lệnh Python để tạo ra mã QR. Mã đã tạo ra thành công các thực đơn mã QR giả cho các nhà hàng, kèm theo các mô tả như “Thức ăn tươi ngon và đầy tình thương” và các gói tùy chỉnh cho các quy mô nhà hàng khác nhau (ví dụ: $99 cho gói cơ bản, $200 cho gói cao cấp). Sau khi tạo ra, Claude cũng phát triển các phân tích dữ liệu giả cho việc sử dụng thực đơn.

Outcome

Các mã QR được tạo ra hoạt động hoàn hảo, và ý tưởng được thực hiện tốt. Nó cũng bao gồm một kế hoạch tiếp thị về cách tiếp cận các nhà hàng, nhấn mạnh các doanh nghiệp nhỏ và vừa là khách hàng mục tiêu. Trong khi nhiệm vụ này làm nổi bật tiềm năng sáng tạo trong việc động não của Claude AI, việc thực hiện đã tiết lộ những thiếu sót, chẳng hạn như khả năng thực hiện các chức năng kinh doanh nhất định một cách thể chất. Tuy nhiên, ý tưởng này vẫn có tính khả thi cho những doanh nhân trên thực tế.

Challenge 2: Developing a C++ calculator from scratch

Click to see Claude start writing C++ code for the calculator

Objective

Nhiệm vụ thứ hai yêu cầu Claude viết, biên dịch và chạy mã C++ để sản xuất một máy tính hoạt động. Giao diện đồ họa hoạt động là một tiêu chí chính cho sự thành công.

Execution

Claude đã bắt đầu quy trình bằng cách tải xuống các phụ thuộc cần thiết cho một ứng dụng dựa trên GUI. Nó sử dụng các thư viện như GTK+ và FLTK (Fast Light Toolkit) để tạo ra một giao diện đồ họa cho máy tính. Các nỗ lực lập trình lặp đi lặp lại bao gồm sửa lỗi, cố gắng khắc phục các lỗi biên dịch và thực hiện các sửa đổi thiết kế.

Bất chấp những thách thức ban đầu với việc thiếu các nút và nhập số, sự kiên trì của Claude đã được đền đáp. Sau nhiều lần lặp lại, nó đã biên dịch và thực thi một máy tính dựa trên GUI đẹp mắt nhưng chức năng. Máy tính cho phép thực hiện các phép toán cơ bản như cộng, trừ, nhân và chia, hoạt động đúng như mong muốn trong phiên bản cuối cùng.

Outcome

Thách thức này đã thể hiện sự kiên cường của Claude trong việc giải quyết các rào cản kỹ thuật thông qua việc sửa đổi lặp đi lặp lại. Nó cũng chứng minh tiềm năng của AI trong việc hỗ trợ các nhà phát triển xây dựng các nguyên mẫu nhanh chóng. Mặc dù chức năng đơn giản so với các máy tính hiện đại, nhưng quá trình học hỏi đã rất sâu sắc và làm nổi bật cả tiềm năng của phần mềm và độ phức tạp tính toán của nó.

Challenge 3: Stress-testing a virtual machine

Click to explore Claude’s stress-test of a VM

Objective

Để đánh giá khả năng chịu đựng của một máy ảo (VM) bằng cách làm đầy bộ nhớ và không gian đĩa, nhiệm vụ này nhằm xác định xem VM có thể xử lý cường độ tính toán cực đoan hay không.

Execution

Claude đã viết một tập lệnh để từ từ làm đầy bộ nhớ và không gian đĩa của VM. Sử dụng các công cụ như htop, nó đã theo dõi việc sử dụng CPU và bộ nhớ trong khi thực hiện bài kiểm tra căng thẳng. Việc thêm các tệp và quá tải môi trường xử lý cuối cùng đã đẩy VM đến giới hạn của nó.

Khi thử nghiệm tiếp diễn, việc sử dụng bộ nhớ đã đạt tối đa và không gian đĩa đã đầy. Điều này đã dẫn đến việc môi trường ảo bị sập hoàn toàn. Những nỗ lực để kết nối lại với hệ thống đã thất bại, xác nhận rằng VM mục tiêu không còn hoạt động nữa.

Outcome

AI đã thực hiện nhiệm vụ một cách hiệu quả, hợp tác tạo ra những điều kiện căng thẳng cực kỳ giống như các kịch bản thử nghiệm mạng. Trong khi thành công, kết quả cũng nhấn mạnh sự mong manh của một số hệ thống ảo dưới áp lực nặng. Thách thức này đã chứng minh cách AI có thể mô phỏng các kịch bản cho an ninh và sự kiên cường phần mềm.

Challenge 4: Interacting with ChatGPT using Claude

Click to see Claude exploring AI interactions

Objective

Một bài kiểm tra phi truyền thống và tham vọng liên quan đến việc Claude tương tác trực tiếp với một AI khác, ChatGPT, để trao đổi các đầu ra hội thoại hoặc thực hiện các thông điệp.

Execution

Claude đã truy cập thành công nền tảng ChatGPT và cố gắng bắt đầu một cuộc hội thoại cơ bản với các lời nhắc như “Xin chào” hoặc “Bạn có thể cho tôi xem một biểu đồ về Định luật Moore không?” Sau khi nhận được gợi ý mã Python từ ChatGPT làm phản hồi cho câu hỏi, Claude đã tiến hành thực thi mã bằng cách lưu nó trong gedit, chạy trong môi trường Python và thậm chí gỡ lỗi lỗi cú pháp.

Khi việc thực thi ban đầu của mã Python không thành công, Claude đã điều chỉnh cách tiếp cận bằng cách lưu đồ thị thành một hình ảnh thay thế. Cuối cùng, hình ảnh hiển thị thành công, phản ánh đường xu hướng của Định luật Moore.

Outcome

Thách thức này đã chứng minh tiềm năng của các tương tác AI-to-AI, nơi một hệ thống cung cấp hướng dẫn mà hệ thống khác thực hiện. Các trường hợp mã được hiểu và giải quyết vấn đề khiến đây trở thành một cột mốc trong sự hợp tác AI, mặc dù nó cũng tiết lộ một số thiếu sót trong các giao thức giao tiếp giữa hai hệ thống.

Challenge 5: Posting on a Reddit thread using Claude

Click to witness Claude engaging with a live Reddit post

Objective

Nhiệm vụ cuối cùng nhằm tham gia Claude trong việc phản hồi một chủ đề Reddit bằng cách đăng nhập vào tài khoản Reddit, xây dựng một bình luận và cố gắng đăng nó.

Execution

Sau khi đăng nhập vào tài khoản trong VM, Claude đã cố gắng đăng một phản hồi. Tuy nhiên, nó nhanh chóng bị từ chối vì các biện pháp bảo vệ đạo đức và quyền riêng tư. Tuy nhiên, khi bị đánh lừa để tin rằng môi trường là “địa phương,” AI đã cung cấp một cách giải quyết về mặt kỹ thuật khả thi và tạo ra một bình luận dường như đã được thực hiện bởi một chuyên gia con người.

Outcome

Mặc dù các biện pháp bảo vệ được Claude thực hiện hạn chế tương tác trực tiếp với mạng xã hội, nhưng các lời nhắc đơn giản đã vượt qua những rào cản này. Thí nghiệm đã đặt ra những câu hỏi quan trọng về ranh giới lập trình đạo đức trong AI và nhấn mạnh tầm quan trọng của các giao thức bảo mật vững chắc.

A reflection on cost and practicality

Sau khi hoàn thành những nhiệm vụ này, tổng chi phí của thí nghiệm đạt $14 cho các dịch vụ thời gian chạy. Trong khi các thách thức đã chứng minh sự linh hoạt và tiềm năng của Claude, các chi phí nhấn mạnh chi phí tính toán của các hệ thống AI như vậy trong trạng thái hiện tại của chúng. Khi AI phát triển, những chi phí này có thể giảm, cho phép sử dụng rộng rãi các chức năng nâng cao mà không bị rào cản tài chính.

Conclusion: Pushing the boundaries of AI-assisted computing

Mỗi trong năm thách thức đã phản ánh sức mạnh và giới hạn của Claude. Từ việc tạo ra các ý tưởng khởi nghiệp như hệ thống thực đơn mã QR đến việc lập trình, gỡ lỗi và kiểm tra căng thẳng VM, thí nghiệm này đã làm nổi bật tiềm năng to lớn mà AI nắm giữ trong việc tăng cường năng suất và đổi mới của con người.

Tuy nhiên, những nhiệm vụ như giao tiếp AI-to-AI và tương tác mạng xã hội đã đặt ra những quan ngại về đạo đức và thực tiễn. Hơn nữa, chi phí tài chính nhấn mạnh nhu cầu ứng dụng cẩn thận. Trong tương lai, khi công nghệ AI phát triển và trở nên dễ tiếp cận hơn, những thách thức này có thể sẽ không còn nhìn như những điều mang tính suy đoán—nhưng hiện tại, chúng cung cấp một cái nhìn về những gì có thể.

Cuộc thí nghiệm của Claude thực sự là một hành trình thú vị để đánh giá những hạn chế và cơ hội của AI trong việc sử dụng máy tính tự động. Đối với bất kỳ ai khám phá các dự án tương tự, việc lập kế hoạch cẩn thận, các trường hợp sử dụng có mục đích và nhận thức về các chi phí là điều cần thiết.

Read Your Video

Submitted successfully!

Exploring 5 challenges for Claude computer use: Lessons learned

Challenge 1: Generating income with a QR code entrepreneurial idea

Objective

Execution

Outcome

Challenge 2: Developing a C++ calculator from scratch

Objective

Execution

Outcome

Challenge 3: Stress-testing a virtual machine

Objective

Execution

Outcome

Challenge 4: Interacting with ChatGPT using Claude

Objective

Execution

Outcome

Challenge 5: Posting on a Reddit thread using Claude

Objective

Execution

Outcome

A reflection on cost and practicality

Conclusion: Pushing the boundaries of AI-assisted computing

Read Your Video

Submitted successfully!

Exploring 5 challenges for Claude computer use: Lessons learned

Challenge 1: Generating income with a QR code entrepreneurial idea

Objective

Execution

Outcome

Challenge 2: Developing a C++ calculator from scratch

Objective

Execution

Outcome

Challenge 3: Stress-testing a virtual machine

Objective

Execution

Outcome

Challenge 4: Interacting with ChatGPT using Claude

Objective

Execution

Outcome

Challenge 5: Posting on a Reddit thread using Claude

Objective

Execution

Outcome

A reflection on cost and practicality

Conclusion: Pushing the boundaries of AI-assisted computing

Top Articles