
- ওপেনাইয়ের সর্বশেষ এআই মডেলগুলি, জিপিটি ও 3 এবং ও 4-মিনিটের পূর্বসূরীদের তুলনায় উল্লেখযোগ্য পরিমাণে উচ্চতর হ্যালুসিনেশন রয়েছে
- মডেলগুলিতে জটিলতা বৃদ্ধি আরও আত্মবিশ্বাসী ভুল হতে পারে
- উচ্চ ত্রুটির হার বাস্তব জীবনের অ্যাপ্লিকেশনগুলিতে এআই নির্ভরযোগ্যতা সম্পর্কে উদ্বেগ বাড়ায়
উজ্জ্বল তবে অবিশ্বস্ত মানুষ হ’ল উপন্যাসের প্রধান খাদ্য (এবং ইতিহাস)। ওপেনাইয়ের জরিপ অনুসারে, এটি এআইয়ের একই সম্পর্কের ক্ষেত্রেও প্রযোজ্য নিউ ইয়র্ক টাইমস। যেহেতু এর সৃষ্টি, হ্যালুসিনেশন, কাল্পনিক তথ্য এবং সোজা মিথ্যাগুলি এআই চ্যাটবটসের অংশ হয়ে উঠেছে। তত্ত্ব অনুসারে, মডেলগুলির উন্নতিগুলি তাদের ঘটনার ফ্রিকোয়েন্সি হ্রাস করা উচিত।
ওপেনাইয়ের সর্বশেষ ফ্ল্যাগশিপ মডেলগুলি, জিপিটি ও 3 এবং ও 4-মিনিট, মানব যুক্তি নকল করার জন্য ডিজাইন করা হয়েছে। তাদের পূর্বসূরীদের বিপরীতে যারা প্রাথমিকভাবে সাবলীল পাঠ্য প্রজন্মের দিকে মনোনিবেশ করেছিলেন, ওপেনএআই ধাপে ধাপে জিনিসগুলি সম্পর্কে চিন্তা করার জন্য জিপিটি ও 3 এবং ও 4-মিনিট তৈরি করেছিল। ওপেনই গর্বিত করেছিল যে ও 1 রসায়ন, জীববিজ্ঞান এবং গণিতে পিএইচডি শিক্ষার্থীর পারফরম্যান্সের সাথে মেলে বা অতিক্রম করতে পারে। তবে ওপেনাইয়ের প্রতিবেদনে যে কেউ চ্যাটজিপিটি প্রতিক্রিয়াগুলি পৃষ্ঠের মান হিসাবে প্রতিক্রিয়া জানায় তার বেদনাদায়ক ফলাফলগুলি হাইলাইট করে।
ওপেনাই আবিষ্কার করেছে যে জিপিটি ও 3 মডেল জনসাধারণের ব্যক্তিত্বদের সাথে জড়িত মানদণ্ডের এক তৃতীয়াংশে হ্যালুসিনেশনগুলিকে অন্তর্ভুক্ত করেছে। এটি গত বছরের গোড়ার দিকে ও 1 মডেলের ত্রুটি হারের দ্বিগুণ। আরও কমপ্যাক্ট O4-mini মডেলের পারফরম্যান্স আরও খারাপ, অনুরূপ কাজের 48% হ্যালুসিনেট করে।
সিম্পলকিউএ মানদণ্ডের জন্য আরও সাধারণ জ্ঞানের প্রশ্নগুলি পরীক্ষা করার সময়, হ্যালুসিনেশনগুলি ও 3 এর উত্তরের 51% এবং O4-MINI এর 79% উদ্ভূত হয়। এটি কেবল সিস্টেমে শব্দ নয়। এটি একটি পরিপক্ক পরিচয় সংকট ছিল। আপনি ভাবতে পারেন যে যুক্তিযুক্ত সিস্টেম হিসাবে বিক্রি হওয়া কোনও কিছু উত্তর দেওয়ার আগে কমপক্ষে আপনার নিজের যুক্তিটি দু’বার পরীক্ষা করবে, তবে এটি ক্ষেত্রে নয়।
একটি তত্ত্ব যা এআই গবেষণা সম্প্রদায়ের ভ্রমণ করে তা হ’ল কোনও মডেল যত বেশি যুক্তি দেওয়ার চেষ্টা করে, এর থেকে বেরিয়ে আসার সম্ভাবনা তত বেশি। উচ্চ আত্মবিশ্বাসের পূর্বাভাসগুলিতে আটকে থাকা সহজ মডেলগুলির বিপরীতে, অনুমানের মডেলগুলি রাজ্যে প্রবেশ করে, যেখানে তাদের একাধিক সম্ভাব্য পাথগুলি মূল্যায়ন করতে হবে, বিভিন্ন তথ্যকে সংযুক্ত করতে হবে এবং মূলত অসম্পূর্ণতা রয়েছে। সত্যের চারপাশে ইম্প্রোভাইজেশনকে মেক আপও বলা হয়।
কাল্পনিক ফাংশন
সম্পর্ক কোনও কার্যকারণ সম্পর্ক নয়, ওপেনাই বলে যুগ হ্যালুসিনেশনের বৃদ্ধি নাও হতে পারে কারণ অনুমানের মডেলটি সহজাতভাবে আরও খারাপ। পরিবর্তে, তাদের উত্তরগুলি আরও বিশদ এবং ঝুঁকিপূর্ণ হতে পারে। যেহেতু নতুন মডেলটি কেবল অনুমানযোগ্য তথ্যগুলি পুনরাবৃত্তি করে না, তবে সম্ভাবনার উপরও অনুমান করে, তাই তত্ত্ব এবং মনগড়া তথ্যগুলির মধ্যে সীমানা এআই অস্পষ্ট করতে পারে। দুর্ভাগ্যক্রমে, এর মধ্যে কয়েকটি সম্ভাবনা সম্পূর্ণ অবাস্তব বলে মনে হয়।
তবুও, আরও হ্যালুসিনেশনগুলি ওপেনএআই বা এর প্রতিযোগীদের বিপরীতে যেমন গুগল এবং অত্যাধুনিক মডেলগুলির মানুষের প্রয়োজন। এআই চ্যাটবট সহকারী এবং সহ-পাইলটকে কল করার অর্থ তারা বিপজ্জনক নয়, সহায়ক হবে। অনুমানমূলক আদালতের উদ্ধৃতিটি লক্ষ্য না করেই অ্যাটর্নিরা চ্যাটজিপিটি ব্যবহার করে সমস্যায় পড়েছেন। এই জাতীয় কতগুলি ত্রুটি কম উচ্চ-ঝুঁকিপূর্ণ পরিস্থিতিতে সমস্যা সৃষ্টি করে কে জানে?
শ্রেণিকক্ষ, অফিস, হাসপাতাল এবং সরকারী সংস্থাগুলিতে এআই সিস্টেমগুলি চালু হতে শুরু করার সাথে সাথে ব্যবহারকারীদের সমস্যা তৈরি করার ফলে হ্যালুসিনেশনের সম্ভাবনা দ্রুত প্রসারিত হচ্ছে। বিস্তৃত এআই কাজের অ্যাপ্লিকেশনগুলি খসড়া করতে, বিলিং সমস্যাগুলি সমাধান করতে বা স্প্রেডশিটগুলি বিশ্লেষণ করতে সহায়তা করতে পারে তবে প্যারাডক্সটি হ’ল এআই যত বেশি কার্যকর, ত্রুটির জন্য কম জায়গা।
লোকেরা যদি আপনার যা কিছু বলে তার চলমান পর্যালোচনাগুলি যতক্ষণ সম্ভব ব্যয় করতে হয় তবে আপনি সময় এবং শক্তি সঞ্চয় করার দাবি করতে পারবেন না। এই মডেলগুলি চিত্তাকর্ষক নয় তা নয়। জিপিটি ও 3 কোডিং এবং যুক্তির কিছু আশ্চর্যজনক বৈশিষ্ট্য দেখায়। এটি এমনকি অনেক লোককে কিছু উপায়ে ছাড়িয়ে যেতে পারে। সমস্যাটি হ’ল যখন এটি সিদ্ধান্ত নেয় যে আব্রাহাম লিংকন একটি পডকাস্ট হোস্ট করে বা সেই মুহুর্তে যখন জল ৮০ ডিগ্রি ফারেনহাইটে ফুটে ওঠে, নির্ভরযোগ্যতা ভেঙে যাওয়ার কল্পনা।
আপনি এই সমস্যাগুলি সমাধান করার আগে আপনার এআই মডেলের যে কোনও লবণের প্রতিক্রিয়া জানানো উচিত। কখনও কখনও, আমরা যে সভায় অংশ নিয়েছি তাতে চ্যাটজিপ্ট কিছুটা বিরক্তিকর ব্যক্তির মতো। মোট বাজে আত্মবিশ্বাস পূর্ণ।