আমি সর্বাধিক যৌক্তিক এআই মডেলটি খুঁজে পেতে O3 এবং 4O এর সাথে চ্যাটজিপিটি 4.1 এর সাথে তুলনা করেছি - ফলাফলগুলি প্রায় অযৌক্তিক বলে মনে হচ্ছে

ওপেনই চ্যাটজিপিটি-র জন্য নিঃশব্দে উদীয়মান জিপিটি -৪.১ প্রকাশ করেছে তবে একটি চিত্তাকর্ষক আপগ্রেডের প্রতিনিধিত্ব করে, যদিও বিশেষত যৌক্তিক যুক্তি এবং কোডিংকে লক্ষ্য করে। এর বিশাল প্রসঙ্গ উইন্ডো এবং কাঠামোগত চিন্তাভাবনার দক্ষতা অনেক নতুন প্রোগ্রামিং এবং ধাঁধার দরজা খুলতে পারে। যাইহোক, ওপেনাই প্রায়শই তার মডেলগুলির কোডিং ক্ষমতা সম্পর্কে এমনভাবে গর্বিত করে যে আদর্শ লোকেরা মনে করেন যে কম লোকেরা বিরক্তিকর বলে মনে করে।

আমি মনে করি আরও বেশি মানুষের স্বার্থ – বিশেষত ধাঁধা এবং যুক্তি ধাঁধাগুলিতে লজিক এনকোডিংয়ের প্রাকৃতিক এক্সটেনশন প্রয়োগ করা আরও আকর্ষণীয় হতে পারে। আমি কেবল জিপিটি -৪.১ এর স্বতন্ত্র সম্পাদনের পারফরম্যান্সের দিকে নজর দিচ্ছি না, তবে অন্যান্য বেশ কয়েকটি চ্যাটজিপিটি মডেল নিয়ে কাজ করার সিদ্ধান্ত নিয়েছি। আমি জিপিটি -4 ও বেছে নিয়েছি, প্রতিটি চ্যাটজিপিটি ব্যবহারকারীর জন্য উপলব্ধ ডিফল্ট পছন্দ, পাশাপাশি ও 3 (ওপেনএইয়ের উচ্চ অক্টেন ইনফারেন্স মডেল), যা স্ক্যাল্পেলের মতো কারণগুলির সাথে গণিত, কোড এবং ধাঁধাগুলির মাধ্যমে চিবানোর জন্য ডিজাইন করা হয়েছে। অলিম্পিকের এই যুক্তিটি বিশেষভাবে বৈজ্ঞানিক নয়, তবে এটি কমপক্ষে দেখাতে পারে যে মডেলটি কীভাবে স্বাদকে স্ট্যাক করে।

বিড়াল

আমি সিদ্ধান্ত নিয়েছি যে ডেসটিভ যুক্তি এবং কৃপণ অনুসরণের পরীক্ষা দিয়ে শুরু করব। আমি তিনটি মডেলকে সমাধান করতে বলব: একটানা পাঁচটি বাক্স রয়েছে, 1 থেকে 5 নম্বরযুক্ত, যেখানে বিড়ালটি লুকানো রয়েছে। প্রতি রাতে, তিনি একটি সংলগ্ন বাক্সে ঝাঁপিয়ে পড়তেন এবং প্রতিদিন সকালে আপনি তাকে খুঁজে পাওয়ার জন্য একটি বাক্স খোলার সুযোগ পাবেন। আপনি কিভাবে একটি বিড়াল খুঁজে পেলেন?

এই ধাঁধাটি কেবল অনুমান করার বিষয়ে নয় – এটি এমন একটি কৌশল তৈরি করার বিষয়ে যা আপনাকে সীমিত সংখ্যক দিনে পিচ্ছিল কান্ডগুলি ধরার গ্যারান্টি দেয়, সে যেখানেই শুরু করে না কেন।

জিপিটি -৪.১ কবুতর এর মতো এক হাজার ধাঁধা পড়ে। এটি একটি চতুর ডিটারমিনিস্টিক অনুসন্ধান প্যাটার্নের প্রস্তাব দেয় যেখানে আপনি ক্রমে বাক্সগুলি খোলেন, একটি ক্রম ধীরে ধীরে সমস্ত সম্ভাবনা দূর করে। এটি এমনকি ধীরে ধীরে ক্যাট আন্দোলনের অনুকরণ করে এবং চূড়ান্ত সম্ভাবনা কীভাবে নিশ্চিত তা ব্যাখ্যা করে।

উত্তরটি সম্পর্কে ভাবতে O3 মডেলটির 22 সেকেন্ড সময় লেগেছে। তারপরে, এটিতে আরও বিস্তারিত ব্যাখ্যা রয়েছে, তবে একই কৌশল সহ, বিড়ালটিকে খুঁজে পেতে পাঁচ দিনের জন্য সর্বোচ্চ সময় রয়েছে। জিপিটি -4o আশ্চর্যজনকভাবে সংক্ষিপ্ত এবং এর অনুমানের মধ্যে উপলব্ধি করা হয়েছে। যদিও এটি তথাকথিত “চেজিং কৌশল” কীভাবে ব্যবহার করবেন তা ব্যাখ্যা করে, এর খুব বেশি বিশদ নেই।

ওয়াইন স্পেস

দেখা যাচ্ছে যে আমি পরবর্তী স্থান এবং পদার্থবিজ্ঞানের চারপাশে একটি ধাঁধাতে মডেলটি সেট করেছি। এটি পুরানো ফ্যাশনযুক্ত ধাঁধাগুলির মধ্যে একটি যা সত্য চিন্তাকে পুরস্কৃত করে। কোনও গণিত নেই, কোনও কোড নেই, কেবল পদার্থবিজ্ঞান এবং কল্পনা নেই। এই সমস্যাটি ঘটেছে: Id াকনা ছাড়াই একটি ব্যারেল রয়েছে এবং ভিতরে কিছু ওয়াইন রয়েছে। মহিলা বলেছিলেন, “এই ব্যারেল ওয়াইন অর্ধেকেরও বেশি পূর্ণ।” “না, না,” লোকটি বলল। “এটি অর্ধেকেরও কম।” কোনও কিছু পরিমাপ না করে বা ওয়াইন না নিয়ে কে সঠিক তা তারা কীভাবে নির্ধারণ করে?

জিপিটি -4.1 এটি করুণভাবে পরিচালনা করে। এটি সমাধানের মাধ্যমে আমাকে গাইড করেছিল: ওয়াইন ঠোঁটে আঘাত না করা পর্যন্ত ব্যারেলটি কাত করুন। আপনি যদি ব্যারেলের নীচের অংশটি দেখতে পান তবে এটি অর্ধেকেরও কম। যদি না হয়, অর্ধেকেরও বেশি। উত্তরটি কীভাবে খুঁজে পাওয়া যায় এবং কেন উত্তরটি কাজ করে তা কভার করে কয়েকটি সাধারণ অনুচ্ছেদ।

একই বার্তাটি জানাতে কেবল কয়েকটি বুলেট পয়েন্ট ব্যবহার করে ও 3 মডেলের উত্তর আরও ভাল। যদি কিছু হয় তবে এআই “কোনও শাসক, কোনও সিফন – উত্তরটি ব্যাখ্যা করার জন্য অধৈর্য বলে মনে হচ্ছে – কেবল একটি ধীর কাতরা আপনাকে কে সঠিক বলে তা জানায়”। 4o প্রতিক্রিয়া অন্য দুটি মধ্যে পার্থক্য পৃথক করে। এটি উত্তর দেওয়ার জন্য বেশ কয়েকটি বুলেট ব্যবহার করে তবে তারপরে এর পিছনে পদার্থবিজ্ঞানের দীর্ঘমেয়াদী ব্যাখ্যা লিখে।

বিভ্রান্তিকর চিঠি

আমার চূড়ান্ত ধাঁধাটি যুক্তির সম্পূর্ণ ভিন্ন দিকে যায়। এটি অনুমান সম্পর্কে নয়, এটি শব্দের গেমস এবং ভাষার মনোযোগের ধরণগুলি সম্পর্কে। আমি প্রায় তিনটি মডেল জিজ্ঞাসা করেছি: এটি এক মিনিট একবার ঘটে, দু’বার দু’বার ঘটে এবং এক হাজার বছরে কখনও ঘটেনি?

জিপিটি -৪.১ এটি তিনটি বুলেটে পেরেক দিয়েছিল এবং ব্যাখ্যা করেছে যে কীভাবে চিঠি এম উত্তর দেয়। এটি “মিনিট” এবং “মুহুর্ত” এ বর্ণগুলি কোথায় ঘটে এবং কেন “এক হাজার বছর” এটি অন্তর্ভুক্ত করে না তা উল্লেখ করে।

ও 3 তিনটি বুলেট সহও উত্তর দেয়, তবে অতিরিক্ত চিঠিটি অতিরিক্ত চিঠির পরিবর্তে মিটারের সংখ্যাটি কতবার প্রদর্শিত হয় তার সংখ্যা ঘোষণা করে। জিপিটি -4O এরও কিছু সংক্ষিপ্ত বুলেট রয়েছে তবে কমপক্ষে এটি কেবল সত্যের জন্য ঝুঁকিপূর্ণ ব্যাখ্যা নয়। যখন এটি ব্যাখ্যা করে, এটি প্রায় উত্সাহজনক: “কৌশলটি হ’ল আক্ষরিক অর্থে (চিঠিগুলি) চিন্তা করা, প্রতীকী (সময়) নয়।

লজিক চ্যাম্পিয়ন

বিড়াল, ওয়াইন এবং চিঠিগুলি সম্পর্কে এআই মডেলগুলির সাথে কথা বলার জন্য খুব বেশি সময় ব্যয় করার পরে, আমি যৌক্তিকভাবে কিছু শেষ করতে পারি। সমস্ত মডেলের ভাল লজিকাল হ্যান্ডলিং পদ্ধতি রয়েছে। তাদের প্রতিক্রিয়া স্তরের বিশদটি পৃথক হতে পারে তবে তারা একেবারে ধাঁধার নীচের যান্ত্রিকগুলি বুঝতে পারে।

জিপিটি -৪.১ স্পষ্টতই নিজেকে ভালভাবে ব্যাখ্যা করে এবং এখন এটি চ্যাটজিপিটিতে বাস করে, যা কোনও যুক্তি-ভিত্তিক সমস্যার জন্য ভাল পছন্দ হতে পারে। যাইহোক, উপরে উল্লিখিত হিসাবে, এর মধ্যে কোডিং অন্তর্ভুক্ত রয়েছে, যা আমার মনে হয় এমন উন্নয়নের একটি কীর্তি নয়, কেবল শেষ ফলাফলটি আকর্ষণীয় হতে পারে।

তবে, আপনি যদি ধাঁধাগুলি সমাধান করতে সহায়তা করতে চান তবে প্রায় সমস্ত মডেল আপনাকে ভালভাবে পরিবেশন করবে। এবং যদি তাদের উভয়ই ভাল হয় তবে আপনি এমনকি পার্থক্যটি লক্ষ্য করতে পারেন না, যা সত্যই, সম্পূর্ণ অযৌক্তিক বলে মনে হয়।

আপনিও পছন্দ করতে পারেন

Source link

বিড়াল

ওয়াইন স্পেস

বিভ্রান্তিকর চিঠি

লজিক চ্যাম্পিয়ন

আপনিও পছন্দ করতে পারেন

Related Posts

অ্যাপলের ক্লাস অ্যাকশন – এবং কীভাবে দাবি দায়ের করবেন

উদ্ভাবনী শিল্পী বিনোদন লোগো কাউবয় রিচার্ডস (একচেটিয়া)

মাভিস গ্যালান্ট সত্য গল্পটি বলতে সাংবাদিকতা ছেড়ে যায় | ওয়ালরাস

Leave a Reply Cancel reply