Hiện tại, OpenAI đã giới thiệu một công cụ thu thập dữ liệu web có tên “GPTBot”, nhằm mục đích củng cố khả năng của các mô hình GPT trong tương lai.
Công ty cho biết dữ liệu được tích lũy thông qua GPTBot có khả năng nâng cao độ chính xác của mô hình và mở rộng khả năng của nó, đánh dấu một bước quan trọng trong quá trình phát triển các mô hình ngôn ngữ được hỗ trợ bởi AI.
⬇⬇ Tham gia Group để nhận ngay bộ công cụ AI x3 hiệu suất làm việc ⬇⬇
GPTBot là gì ?
GPTBot hay trình thu thập dữ liệu web – còn được gọi là trình thu thập dữ liệu web – đóng vai trò then chốt trong việc lập chỉ mục nội dung trên phạm vi rộng lớn của internet.
Các công cụ tìm kiếm nổi tiếng như Google và Bing dựa vào các bot này để đưa vào kết quả tìm kiếm của họ các trang web có liên quan.
Tuy nhiên, GPTBot của OpenAI sẽ có một mục đích riêng biệt: Chỉ thu thập dữ liệu công khai có sẵn trên Internet, cẩn thận tránh các nguồn liên quan đến dữ liệu cá nhân hoặc nội dung trái với chính sách của OpenAI.
Vì vậy, nếu bạn muốn cho phép IP GPTBot truy cập vào lấy dữ liệu của bạn. Bạn phải allow các dải IP của OpenAI dưới dây.
{
"creationTime": "2023-09-15T23:01:00.000000",
"prefixes": [
{
"ipv4Prefix": "20.15.240.64/28"
},
{
"ipv4Prefix": "20.15.240.80/28"
},
{
"ipv4Prefix": "20.15.240.96/28"
},
{
"ipv4Prefix": "20.15.240.176/28"
},
{
"ipv4Prefix": "20.15.241.0/28"
},
{
"ipv4Prefix": "20.15.242.128/28"
},
{
"ipv4Prefix": "20.15.242.144/28"
},
{
"ipv4Prefix": "20.15.242.192/28"
},
{
"ipv4Prefix": "40.83.2.64/28"
},
{
"ipv4Prefix": "20.9.164.0/24"
}
]
}
Chủ sở hữu trang web có khả năng ngăn GPTBot thu thập dữ liệu trang web của họ chỉ bằng cách thực hiện lệnh “không cho phép” trong tệp máy chủ tiêu chuẩn.
Điều này cấp cho họ quyền kiểm soát những phần nội dung nào có thể được trình thu thập dữ liệu web truy cập.
Thông tin liên quan về GPT-5
Thông báo của OpenAI diễn ra ngay sau khi công ty nộp đơn đăng ký nhãn hiệu cho “GPT-5”, được dự đoán sẽ thành công với mẫu GPT-4 hiện tại.
Hồ sơ được nộp cho Văn phòng bằng sáng chế và Thương hiệu Hoa Kỳ vào ngày 18 tháng 7, bao gồm việc sử dụng “GPT-5” trong giọng nói và văn bản của con người dựa trên AI, chuyển đổi âm thanh thành văn bản, nhận dạng giọng nói và tổng hợp giọng nói.
Tuy nhiên, trong khi GPT-5 đã tạo ra sự phấn khích trong những người đam mê AI thì giám đốc điều hành Sam Altman của OpenAI lại cảnh báo không nên kỳ vọng quá sớm.
Altman tiết lộ rằng công ty vẫn còn lâu mới bắt đầu đào tạo GPT-5 vì cần phải tiến hành kiểm tra an toàn rộng rãi trước khi bắt tay vào quá trình này.
Những nỗ lực gần đây của OpenAI không phải là không có những tranh cãi. Đã nảy sinh những lo ngại về hoạt động thu thập dữ liệu của công ty, đặc biệt là xung quanh các vấn đề về bản quyền và sự đồng ý. Vào tháng 6, cơ quan quản lý quyền riêng tư của Nhật Bản đã đưa ra cảnh báo cho OpenAI liên quan đến việc thu thập dữ liệu trái phép.
Đầu năm nay, Ý đã tạm thời cấm sử dụng ChatGPT do bị cáo buộc vi phạm luật riêng tư của Liên minh Châu Âu.
#source: artificialintelligence-news.com
AIVA – Trợ lý ảo toàn năng
AIVA là một giải pháp trí tuệ nhân tạo toàn diện gồm hơn 300 trợ lý ảo đa năng và thông minh, giúp tiết kiệm thời gian và công sức bằng cách cung cấp câu trả lời ngay lập tức, thay vì phải tìm kiếm trên Internet hoặc tra cứu tài liệu. Một số tính năng nổi bật của AIVA:
- Trợ lý viết bài, chuyên gia SEO
- Trợ lý tạo video và viết kịch bản
- Trợ lý xử lý và phân tích dữ liệu
- Trợ lý viết quảng cáo, quản lý mạng xã hội
- Trợ lý và chuyên gia tư vấn, chuyên gia sale