ChatGPT، به عنوان پیشگام انقلاب هوش مصنوعی، همچنان محبوبترین ابزار هوش مصنوعی در بازار است که بیش از ۲۰۰ میلیون کاربر فعال هفتگی دارد. اما در میان تمام رقبایش، کدام چتباتهای هوش مصنوعی بیشترین دادههای کاربران را جمعآوری میکنند؟ و چرا این موضوع اهمیت دارد؟
جمینای، پادشاه جمعآوری دادهها
در جایگاه نخست، جمینای گوگل (منتشر شده در مارس ۲۰۲۳) از کاربران خود ۲۲ نقطه داده مختلف را در ۱۰ دستهبندی جمعآوری میکند.
دادههای جمعآوری شده از اطلاعات عمومی تشخیصی (که تمام باتهای موجود در این مطالعه جمعآوری میکنند) تا دسترسی به مخاطبین (که هیچ بات دیگری در این بررسی جمعآوری نمیکند) متغیر است.
رتبهچتبات هوش مصنوعیمجموع نقاط داده جمعآوری شدهدستهها۱جمینhی۲۲اطلاعات تماس، موقعیت مکانی، مخاطبین، محتوای کاربر، تاریخچه، شناسهها، تشخیصی، دادههای استفاده، خریدها، سایر دادهها۲کلود۱۳اطلاعات تماس، موقعیت مکانی، محتوای کاربر، شناسهها، تشخیصی، دادههای استفاده۳کوپایلت۱۲اطلاعات تماس، موقعیت مکانی، محتوای کاربر، تاریخچه، شناسهها، تشخیصی، دادههای استفاده۴دیپسیک۱۱اطلاعات تماس، محتوای کاربر، شناسهها، تشخیصی، دادههای استفاده۵چتجیپیتی۱۰اطلاعات تماس، محتوای کاربر، شناسهها، تشخیصی، دادههای استفاده۶پرپلکسیتی۱۰موقعیت مکانی، شناسهها، تشخیصی، دادههای استفاده، خریدها۷گراک۷اطلاعات تماس، شناسهها، تشخیصی
توجه: تعداد نقاط داده جمعآوری شده در هر دسته با توجه به هر بات متفاوت است، که منجر به مجموع متفاوتی میشود.
گراک گوش مصنوعی ایکس (منتشر شده در نوامبر ۲۰۲۳) کمترین نقاط داده منحصر به فرد (۷) را جمعآوری میکند.
دیپسیک چین (منتشر شده در ژانویه ۲۰۲۵)، با ۱۱ نقطه داده، به راحتی در میانه این فهرست قرار میگیرد.
نوع دادههای جمعآوری شده توسط هر یک از این ابزارهای هوش مصنوعی متفاوت است. همه آنها اطلاعات تشخیصی عمومی را جمعآوری میکنند. تقریباً همه به جز پرپلکسیتی و گراک، محتوای کاربر را جمعآوری میکنند.
محتوای کاربر نوعی از اطلاعات است که معمولاً به دادههای شخص ثالث پیوند داده میشود و سپس برای تبلیغات هدفمند در پلتفرم به تبلیغکنندگان فروخته میشود.
قاعده کلی در مورد حریم خصوصی دادهها برای چتباتهای هوش مصنوعی نیز صادق است. در نهایت، اطلاعات در سرورهای آنها ذخیره میشود و این سرورها میتوانند مورد نفوذ قرار گیرند.