এআই ইমেজ তৈরির টিউটোরিয়াল এবং তুলনা: ডাল-ই ভিএস স্টেবল ডিফিউশন ভিএস ক্যানভা (টেক্সট টু ইমেজ)

বর্তমান মিডিয়ার জনপ্রিয়তার সাথে চ্যাটজিপিটি এটি সম্পর্কে কথা বলার একটি সুযোগ ডাল-ই, আরেকটি কৃত্রিম বুদ্ধিমত্তা দ্বারা পরিকল্পিত ওপেন এআই ! এবং আরও সাধারণভাবে ইমেজ তৈরিকারী AIs। যেখানে ChatGPT বিরক্তিকর সহজে লিখিত টেক্সট তৈরি করতে সক্ষম, সেখানে DALL-E এবং এর ইল্ককে ব্যবহারকারীর কাছ থেকে একটি সহজ লিখিত অনুরোধ থেকে ছবি তৈরি করার প্রশিক্ষণ দেওয়া হয়েছে।

চলুন এক নজরে দেখে নেওয়া যাক তারা কীভাবে কাজ করে, তাদের ক্ষমতা, কিন্তু তাদের সীমাও ইমেজ তৈরির এআই-এর এই তুলনামূলক নিবন্ধের সাথে।

কিন্তু উপায় দ্বারা, একটি AI কিভাবে কাজ করে?

একটি খুব ভাল প্রশ্ন যা দ্রুত ফিরে আসা আকর্ষণীয় হতে পারে, বিশেষ করে যেহেতু আমরা ChatGPT সম্পর্কে আমাদের পূর্ববর্তী নিবন্ধে এটিকে সম্বোধন করিনি। আপনি যখন "কৃত্রিম বুদ্ধিমত্তা" শোনেন তখন এই ধরনের হিউম্যানয়েড রোবটের কথা মনে না রাখা কঠিন, যেমনটা আমরা সিনেমায় দেখেছি। এই কীওয়ার্ডগুলির জন্য অনুসন্ধানের সাথে সম্পর্কিত একটি চিত্রের জন্য জিজ্ঞাসা করা হলে AIs নিজেরাই এটি তৈরি করে, যেমন এই নিবন্ধের পরিচায়ক চিত্র।

এই ল্যান্ডস্কেপটি বিদ্যমান নেই, এটি 100% কৃত্রিম একটি AI দ্বারা উত্পন্ন

তবুও বাস্তবে, বিদ্যমান অনেক AI-এর কোনো শারীরিক খাম নেই। প্রকৃতপক্ষে, বেশিরভাগ সময়, এটি নির্দিষ্ট অ্যালগরিদমের উপর ভিত্তি করে কম্পিউটার প্রোগ্রাম যা কিছু কম বা কম জটিল কাজ সম্পাদন করার জন্য মানুষ প্রশিক্ষিত হয়েছে।

ইমেজ জেনারেশন এমন একটি কাজ যা এক (বা একাধিক) AI-কে দেওয়া যেতে পারে! এআই দ্বারা চিত্র তৈরির পদ্ধতি সম্পর্কে আরও জানতে, নিম্নলিখিত ভিডিওটি দেখতে দ্বিধা করবেন না:

আসুন কৃত্রিম বুদ্ধিমত্তা দিয়ে আমাদের প্রথম ছবি তৈরি করি

এটি করার জন্য, প্রথম দর্শনে কিছুই সহজ হতে পারে না, যেহেতু আপনাকে যা করতে হবে তা হল AI এর কাছে পাঠ্যভাবে বর্ণনা করা যা আপনি পেতে চান। এই নিবন্ধটির জন্য আমরা তিনটি এআই জেনারেটরের দেওয়া চিত্রগুলির তুলনা করার সিদ্ধান্ত নিয়েছি:

  • ডাল-ই
  • স্থিতিশীল বিস্তার
  • ক্যানভা (টেক্সট টু ইমেজ)

অবশ্যই, এমন আরও কিছু আছে যা আপনার পাশাপাশি পরীক্ষা করতে দ্বিধা করা উচিত নয়। এখানে একটি অ সম্পূর্ণ তালিকা.

আপনি যদি একটু সৃজনশীল হন, আমরা নিশ্চিত যে আপনি ছবি তৈরি করার জন্য প্রচুর ধারণা পাবেন৷ তবে যাদের জন্য এটি একটু জটিল হবে তাদের জন্য একটু সাহায্যের জন্য ChatGPT জিজ্ঞাসা করা সম্ভব। হ্যাঁ, আমরা অন্য এআই ব্যবহার করতে একটি AI ব্যবহার করেছি...

প্রশ্নটির ChatGPT-এর উত্তর: আমাকে dall.e-এ একটি নিবন্ধ লিখতে হবে, এই এআই মডেলের মাধ্যমে তৈরি করা যেতে পারে এমন ছবি সম্পর্কে আপনার কি কোনো ধারণা আছে?

অবশ্যই, একটি ইমেজ জেনারেশন মডেল হিসেবে, DALL-E বিভিন্ন ধরনের ইমেজ তৈরি করতে পারে। আপনি DALL-E দিয়ে তৈরি করতে পারেন এমন চিত্রগুলির জন্য এখানে কিছু ধারণা রয়েছে:

  1. ফ্যান্টাসি অ্যানিমালস: DALL-E কে কাল্পনিক প্রাণীর ছবি তৈরি করতে বলুন, যেমন প্রজাপতির ডানাওয়ালা ড্রাগন বা পাওয়ালা সাপ।
  2. অদ্ভুত খাবার: DALL-E কে অস্বাভাবিক খাবারের ছবি তৈরি করতে বলুন, যেমন চকোলেট পিৎজা বা তরমুজের টুকরো সহ বার্গার।
  3. অস্বাভাবিক পোশাক: DALL-E কে অদ্ভুত পোশাকের ছবি তৈরি করতে বলুন, যেমন আইফেল টাওয়ার-আকৃতির টুপি বা ডানা সহ জুতা।
  4. কাল্পনিক ল্যান্ডস্কেপ: DALL-E কে কল্পনার ল্যান্ডস্কেপের ছবি তৈরি করতে বলুন, যেমন মেঘের মধ্যে ভাসমান একটি শহর বা বিশাল মাশরুমের বন।
  5. হাইব্রিড অবজেক্ট: DALL-E কে এমন বস্তুর ছবি তৈরি করতে বলুন যা দুটি ভিন্ন জিনিসের মিশ্রণ, যেমন একটি বিছানা যা দেখতে হ্যামক বা পাখির ডানাওয়ালা গাড়ি।
  6. সেলিব্রিটি পোর্ট্রেট: DALL-E-কে সেলিব্রিটি পোর্ট্রেটের ছবি তৈরি করতে বলুন যা বিদ্যমান নেই, যেমন ট্যাটু সহ মেরিলিন মনরোর একটি বিকল্প সংস্করণ।
  7. ভবিষ্যত গাড়ি: DALL-E কে ভবিষ্যত গাড়ির ছবি তৈরি করতে বলুন, যেমন একটি গাড়ি যা একটি বিমানে রূপান্তরিত হতে পারে বা একটি গাড়ি যা উড়তে পারে৷
  8. ফ্যান্টাসি আর্কিটেকচার: ফ্যান্টাসি আর্কিটেকচারের ছবি তৈরি করতে DALL-E-কে বলুন, যেমন ড্রাগন আকৃতির আকাশচুম্বী ভবন বা গাছের মতো দেখতে একটি বাড়ি৷

এই ধারণাগুলি আপনাকে DALL-E কী করতে পারে তার একটি ধারণা দেওয়ার জন্য পরামর্শ মাত্র। এই AI টেমপ্লেট দিয়ে আপনি তৈরি করতে পারেন এমন হাজার হাজার অন্যান্য ইমেজ আইডিয়া আছে।

প্রতিটি AI এর নিজস্ব স্টাইল আছে

এই তালিকার সাথে, আসুন একসাথে দেখি কিভাবে আমাদের ছবি তৈরি করতে হয় এবং বেছে নেওয়া বিভিন্ন সফ্টওয়্যারের মধ্যে কোনটি সবচেয়ে ভালো কাজ করে।

এছাড়াও পড়তে:  একটি নতুন স্থানান্তর forum phpbb xNUMX.x থেকে phpbb xNUMX!

আমাদের প্রথম চিত্রের জন্য আমরা প্রজাপতির ডানা সহ ড্রাগনকে উপস্থাপন করতে বেছে নিয়েছি। কিছু প্রসঙ্গ যোগ করার জন্য, আমরা এটিকে "একটি রূপকথার ফ্যান্টাসি বনে" চিত্রিত করার জন্যও বলছি। IAs-এর উপর নির্ভর করে, অনুরোধের ভাষা ফলাফলকে প্রভাবিত করতে পারে। তাই আমরা দ্রুত এটি DALL-E এবং স্থিতিশীল বিস্তারের জন্য খুঁজে পেয়েছি ইংরেজি ছিল সেরা ফলাফল প্রদানকারী ভাষা। বিপরীতভাবে, ক্যানভা-এর টেক্সট টু ইমেজ অ্যাপ্লিকেশন সাধারণত ফরাসি ভাষায় আরও ভালো কাজ করে।

1. DALL-E একটি প্রজাপতি-ডানাযুক্ত ড্রাগনের ছবি তৈরি করেছে

2. স্থিতিশীল বিস্তার দ্বারা উত্পন্ন ড্রাগন

3. এবং অবশেষে আমরা ক্যানভা টুলের জন্য রাখা বেছে নিয়েছি

প্রথম জিনিসটি আমরা খুব দ্রুত দেখতে পাচ্ছি: একই অনুরোধের জন্য, প্রতিটি AI এর নিজস্ব স্টাইল রয়েছে!

  • DALL-E-এর একটি "কল্পনামূলক" দিক রয়েছে, যদিও "রূপকথার গল্প" বনটি পরীর জন্য কিছুটা অন্ধকার, তবে প্রজাপতির ডানাগুলি ভালভাবে উপস্থাপিত এবং ঝরঝরে। এটা শৈলী ডিজিটাল আর্ট.
  • স্থিতিশীল প্রসারণে শৈলীটি আরও "আনন্দময়", একটু শিশুসুলভ. আমরা খুব ভালভাবে কল্পনা করি এই ছবিগুলি শিশুদের জন্য একটি গল্প চিত্রিত করে৷ এখানে ড্রাগনগুলি স্পষ্টভাবে দৃশ্যমান এবং চীনকে স্মরণ করে, যার মধ্যে এটি প্রতীক। অন্যদিকে, AI সম্পূর্ণরূপে প্রজাপতির ডানাগুলিকে অস্পষ্ট করেছে এবং বাস্তব প্রজাপতিগুলিকে আমাদের ড্রাগনগুলির পাশাপাশি উপস্থিত করে সহজ সমাধান বেছে নিয়েছে।
  • অবশেষে ক্যানভা টুলের জন্য, আমরা নির্বাচন থেকে আমাদের অনুরোধের সাথে সঙ্গতিপূর্ণ একমাত্র ছবি নির্বাচন করেছি। যাইহোক, দুটি উপাদান (ড্রাগন এবং উইংস এখানে উপস্থিত)। যদিও সমস্ত ইমেজ ইন-থিম এবং অ্যাকশনেবল, ক্যানভা বিশ্বস্ততার সাথে অনুরোধটি কার্যকর করার জন্য সর্বোত্তম কাজ করে এবং তাই এখানে প্রথম পয়েন্ট অর্জন করে।

অনুরোধ করা চিত্রের শৈল্পিক শৈলীর সম্ভাবনাগুলি কী কী?

যদি শিল্প শৈলী সম্পর্কে কোন বিশদ অনুরোধ না করা হয়, তাহলে AIs ড্রাগনের উদাহরণের মতো আপনার জন্য সেগুলি বেছে নেবে।

তবুও, উদাহরণস্বরূপ, ডাল-ই-এ, নিম্নলিখিত শৈলীগুলি সংজ্ঞায়িত করা সম্ভব:

  • তৈল চিত্র : ডাল-ই আপনি পেইন্টিংটিতে যে রঙ এবং টেক্সচার দেখতে চান তার বর্ণনা থেকে তেল চিত্র তৈরি করতে পারে।
  • ফটোগ্রাফি : Dall-e আপনি ফটোতে যে রঙ, টেক্সচার এবং বিশদ দেখতে চান তার উপর ভিত্তি করে ফটো তৈরি করতে পারে।
  • ডিজিটাল আর্ট : Dall-e একটি প্রাক-পরিকল্পিত টেমপ্লেট থেকে বা আপনি আর্টওয়ার্কটিতে যে রঙ এবং বিবরণ দেখতে চান তার বর্ণনা থেকে ডিজিটাল আর্টওয়ার্ক তৈরি করতে পারে।
  • অমূর্ত চিত্রকলা : ডাল-ই আপনি কাজের মধ্যে যে গতিবিধি, রঙ এবং আকার দেখতে চান তার উপর ভিত্তি করে বিমূর্ত কাজ তৈরি করতে পারে।
  • অঙ্কন : Dall-e আপনি ডিজাইনে যে রঙ এবং আকার দেখতে চান তার উপর ভিত্তি করে ডিজাইন তৈরি করতে পারে।
  • ভেক্টর শিল্প : Dall-e একটি পূর্বনির্ধারিত টেমপ্লেট থেকে বা আপনি ছবিতে দেখতে চান এমন রঙ এবং বিশদ বিবরণ থেকে ভেক্টর চিত্র তৈরি করতে পারে।

ড্রাগনের উদাহরণগুলি ডিজিটাল শিল্প শৈলীতে তৈরি একটি অগ্রাধিকার ছিল। শৈলী দৃঢ়ভাবে চূড়ান্ত উত্পন্ন ইমেজ প্রভাবিত করবে.

এখনও শক্তিশালী, এটা শৈলী অনুরোধ করা সম্ভব কিছু বিখ্যাত শিল্পী. তাই আমরা শৈলীতে একটি চ্যাট তৈরি করেছি পিকাসো, ভ্যান গগ এবং ডালি ! এবং ফলাফল… বেশ অত্যাশ্চর্য!

আমাদের AI-আঁকা বিড়ালটি 3টি দুর্দান্ত পেইন্টিং মাস্টারের শৈলীতে

  1. পিকাসো স্টাইলের বিড়াল
  2. ভ্যান গগ স্টাইলের বিড়াল
  3. ডালি স্টাইলের বিড়াল

আরও ভাল, আমরা তখন একটি " পিকাসো এবং ডালি এবং ভ্যান গগ স্টাইলে বিড়াল এবং আমরা এটি পেয়েছি:

আমরাও অনুরোধ করেছি "পিকাসো স্টাইলে শূকর" এবং ফলাফলটি সমানভাবে ছিল, যদি বেশি না হয়, চিত্তাকর্ষক…

AIs সম্ভবত আগামী বছরগুলিতে শিল্প এবং ইন্টারনেটের ক্ষেত্রে বিপ্লব ঘটাবে, যা ইতিমধ্যেই অনুমানমূলক NFT-এর ক্ষেত্রে।

এছাড়াও পড়তে:  রিস আইনি: ইউরোপে আইনি তথ্য এবং পুনর্নবীকরণযোগ্য বিদ্যুৎ

আমরা বুঝতে পারি পেশাদারদের অবিশ্বাস এই শৈল্পিক এআইগুলির সাথে শিল্পের ক্ষেত্রে, তাদের ভয় ChatGPT-এর মতো চ্যাটবটগুলির সাথে প্রকাশনা এবং সাহিত্য সৃষ্টির মতোই! তারা ঠিক, এই সব ভয়, আমাদের মতে, ন্যায়সঙ্গত!

ডাল-ই দিয়ে একটি ইমেজ তৈরির অনুরোধ করার বিভিন্ন পদ্ধতি কী কী?

আপনার প্রয়োজনের সাথে সঙ্গতিপূর্ণ একটি দ্রুত ফলাফলের জন্য গ্রাফিক পদ্ধতি সহ Dalle-e-এর সাথে একটি চিত্র তৈরির ইঙ্গিত করতে বেশ কয়েকটি পদ্ধতি ব্যবহার করা যেতে পারে:

  • কীওয়ার্ড থেকে ইমেজ তৈরি করা হচ্ছে : আপনি একটি কীওয়ার্ড লিখতে পারেন এবং Dall-e আপনার লেখা কীওয়ার্ডের উপর ভিত্তি করে একটি চিত্র তৈরি করবে।
  • বাক্য থেকে ছবি তৈরি করা : আপনি একটি সম্পূর্ণ বাক্য লিখতে পারেন এবং আপনার প্রবেশ করা বাক্যের উপর ভিত্তি করে Dall-e একটি চিত্র তৈরি করবে।
  • ছবির বর্ণনা থেকে ছবি তৈরি করা হচ্ছে : Dall-e আপনি ছবিতে যে রঙ, আকার এবং বস্তু দেখতে চান তার বিশদ বিবরণ থেকে ছবি তৈরি করতে পারে।
  • দৃশ্য থেকে ছবি তৈরি করা হচ্ছে : ডাল-ই একটি দৃশ্যের সম্পূর্ণ বর্ণনা থেকে 3D ছবি তৈরি করতে পারে।
  • প্যাটার্ন থেকে ছবি তৈরি করা হচ্ছে : ডাল-ই আপনার ইনপুট প্যাটার্ন থেকে ইমেজ তৈরি করতে পারে।
  • টেমপ্লেট থেকে ছবি তৈরি করা হচ্ছে : আপনি Dall-e-কে একটি পূর্বনির্ধারিত টেমপ্লেট প্রদান করতে পারেন এবং এটি আপনার দেওয়া টেমপ্লেটের উপর ভিত্তি করে ছবি তৈরি করবে।
  • অ্যানিমেটেড সিকোয়েন্স থেকে ছবি তৈরি করা : ডাল-ই গতিবিধি, রঙ এবং শব্দের বর্ণনা থেকে অ্যানিমেটেড সিকোয়েন্স তৈরি করতে পারে যা আপনি ক্রমটিতে দেখতে চান।

বাস্তবসম্মত কিন্তু অসম্ভব ছবি

আমরা তখন আমাদের এআই ইমেজ জেনারেটরকে আমাদের আঁকতে বলেছিলাম চোখ দিয়ে একটি সালাদ : দুটি উপাদান যা প্রথম নজরে একসাথে যায় না। তবুও এই মঞ্চে, আমাদের 3টি জেনারেটর কোন আপাত অসুবিধা ছাড়াই এসেছিল।

1. চারটি ছবি, চোখ সহ একটি সালাদ, DALL-E দ্বারা প্রস্তাবিত৷

2. স্ট্যাবল ডিফিউশন দ্বারা উত্পন্ন আমাদের অনুরোধের সাথে সম্পর্কিত দুটি চিত্র

3. এবং ক্যানভা টুলের জন্য দুটি সংশ্লিষ্ট ছবি

এখানে আবার, প্রতিটি চিত্রের নিজস্ব শৈলী রয়েছে, তবে যা বিশেষভাবে আকর্ষণীয় তা হল বিভিন্ন চিত্রের বাস্তবতা: AIs ফটোগ্রাফিক শৈলী ব্যবহার করেছে।

আমরা খাবারগুলিকে বিশেষভাবে ভালভাবে চিনতে পারি, যেখানে আমরা রান্নাঘরে প্রস্তাবিত বিভিন্ন ধারণাগুলি পুনরুত্পাদন করতে চাই। ক্যানভা যদি তবুও "ইমোটিকন" অনুপ্রেরণা সহ একটি চিত্র অফার করে তার মৌলিকত্বের জন্য আলাদা হয়, তবে এখানে DALL-E চারটি ভিন্ন চিত্র এবং সমস্ত অনুরোধ করা থিমে পয়েন্ট জিতেছে।

স্ট্যাবল ডিফিউশনের ফ্লপগুলির মধ্যে, একটি চিত্র এখনও ফিরে আসা মূল্যবান

প্রকৃতপক্ষে, এই ছবিটি বাদ দেওয়া হয়েছে কারণ এটি চোখকে অন্তর্ভুক্ত করে না, আমরা অন্যদিকে কাজের পরিকল্পনার উপস্থাপনায় এআই-এর বাস্তবতার প্রচেষ্টা দেখতে পাই।

আমাদের AIs প্রকৃতপক্ষে "সালাদ" শব্দটিকে সংশ্লিষ্ট পরিবেশের সাথে যুক্ত করতে সক্ষম। এটি ইতিমধ্যেই উপরের চিত্রগুলির ক্ষেত্রে ছিল৷ প্লেট, কাঁটা প্রতিনিধিত্ব এবং রন্ধনসম্পর্কিত অন্যান্য উপাদান।

ফ্লপ যা এখনও নিয়মিত থাকে

তাদের সাধারণ দক্ষতা সত্ত্বেও, আমাদের AI এখনও একটি ভাল পরিমাণ তৈরি করে মাঝারি, ভ্রান্ত ইমেজ চাহিদার সাথে সম্পূর্ণরূপে আউট স্টেপ দেখে. এই আমাদের ক্ষেত্রে ছিল আইফেল টাওয়ার আকৃতির টুপি.

DALL-E আমাদের অনুরোধের কাছে তার একমাত্র চিত্রের সাথে পয়েন্টটি জিতেছে: একটি সাদা টুপি, একটি ক্ষুদ্র টাওয়ার দ্বারা মাউন্ট করা হয়েছে যা আমরা পুরোপুরি কল্পনা করব জেনেভিয়েভ ডি ফন্টেনের প্রধান !

ওপেন এআই-এর AI দ্বারা দেওয়া এই ছোট্ট গিগলটি ছাড়াও, অন্যান্য চিত্রগুলি হয় খুব বাস্তববাদী, কেবল একটি উপাদানের প্রতিনিধিত্ব করে যখন অন্যটিকে অস্পষ্ট করে:

প্রথম ছবিতে স্টেবল ডিফিউশন টাওয়ারের প্রতিনিধিত্ব করে, যখন দ্বিতীয় DALL-E আমাদের অনুরোধের দ্বিতীয় অংশটিকে অস্পষ্ট করে, টুপির স্তুপ পাঠাতে বেছে নিয়েছে।

হয় তাদের অনুরোধের ভুল বোঝার ছিল এই দুটি চিত্রের মতো যেখানে DALL-E বরং আইফেল টাওয়ারের স্যুভেনির মূর্তিগুলিকে উপস্থাপন করে:

এছাড়াও পড়তে:  মা- গুড- অ্যাকশন ডটকম, সংহতি বিপণন, মানবিক এবং দাতব্য

অবশেষে, কিছু ছবি কখনও কখনও সম্পূর্ণরূপে অফবিট হয়, যেমনটি এই চিত্রটির ক্ষেত্রে "IA স্থিতিশীল বিচ্ছুরণের কল্পনা থেকে আসা ব্যক্তি" প্রতিনিধিত্ব করার কথা ছিল যিনি তখন স্বতঃস্ফূর্তভাবে একটি অজানা ভাষায় একটি উদ্ধৃতি যোগ করতে বেছে নিয়েছিলেন...ইংরেজি থেকে বন্ধ...

একটি সংবেদনশীলতা যা কখনও কখনও শব্দ দ্বারা পরিবর্তিত হয়

পরীক্ষাগুলি চালিয়ে, আমরা দ্রুত বুঝতে পারি যে অসন্তোষজনক ফলাফলের ক্ষেত্রে পরিস্থিতি সংশোধন করা আমাদের AI-এর পক্ষে কখনও কখনও যথেষ্ট। তাই যখন আমরা প্রথমবার আমাদের AI-কে জিজ্ঞাসা করি "মেঘলা আকাশে একটি ভাসমান শহর" তাদের প্রত্যেকের জন্য সেরা ছবি নির্বাচন করে, আমরা নিম্নলিখিত ফলাফল পাই:

যথাক্রমে উপরে থেকে নীচে, স্থিতিশীল ডিফিউশন, DALL-E এবং ক্যানভা ফলাফল

খুব সুন্দর ছবি, কিন্তু যা আসলেই আমাদের অনুরোধের "অবাস্তব" অর্থকে প্রতিফলিত করে না যা মানুষের দ্বারা বোঝা যায় কিন্তু দৃশ্যত আমাদের জেনারেটর দ্বারা নয়। সম্পূর্ণ ভিন্ন ফলাফল পেতে চাহিদার একটি সূক্ষ্ম পরিবর্তন প্রয়োজন।

সুতরাং "মেঘলা আকাশে ভাসমান একটি চমত্কার শহর" বাক্যটির সাথে আমরা এই সময়টি পেয়েছি:

1. DALL-E থেকে অনেক বেশি কল্পনাপ্রসূত চিত্র

2. স্টেবল ডিফিউশন থেকে খুব সুন্দর চমত্কার শহর যা "মেঘলা আকাশে ভাসমান" অংশটিকে সম্পূর্ণরূপে বাদ দেয়

3. কিছু দৃশ্য যা ক্যানভা দ্বারা একটি ভিডিও গেম (উদাহরণস্বরূপ মাইনক্রাফ্ট বা লেগো ওয়ার্ল্ডস) থেকে নেওয়া যেতে পারে

এখানে আমরা DALL-E এবং Canva-এর জন্য একটি পয়েন্ট প্রদান করতে পারি যারা উভয়েই আমাদের এক বা অন্য অনুরোধের মাধ্যমে আমাদের শহরকে মেঘের মধ্যে ভাসানোর জন্য পরিচালনা করেছে।

কিন্তু তারপর, ইমেজ প্রজন্মের জন্য কি ভবিষ্যত?

সামগ্রিকভাবে বেশ ভালভাবে কাজ করে এমন একটি সমাধানের মুখোমুখি হয়ে, কেউ ভাবতে পারে যে কৃত্রিম বুদ্ধিমত্তা দ্বারা চিত্র তৈরির ভবিষ্যত ব্যবহার কী হতে পারে। অবশ্যই ইন্টারনেটে ব্যর্থতার সৃষ্টি এখানে উদ্ধৃত করতে লোভনীয়, আসতে দ্বিধা করবেন না আমাদের পোস্ট forum যেগুলি আপনি ইতিমধ্যেই অনলাইনে এসেছেন।

কিন্তু আমরা আরও গুরুতর ব্যবহার কল্পনা করতে পারি। এইভাবে ক্যানভা টুলকে একটি "গাছ যা আসলে একটি ঘর" এর একটি চিত্র তৈরি করতে বলে প্রাপ্ত ফলাফলগুলি সহজেই প্রকৃতির সাথে মিশে যেতে পারে এমন বাসস্থান তৈরির জন্য দায়ী একজন স্থপতিকে ধারণা দিতে পারে!

কিন্তু তারপর, আমাদের 3টি ইমেজ জেনারেটরের মধ্যে কোনটি সবচেয়ে ভালো করছে?

গাছের জন্য যা একটি ঘরও হবে, আমরা সহজেই প্রতিটি টুলে একটি পয়েন্ট দিতে পারি!

DALL-E দ্বারা যথাক্রমে প্রস্তাবিত চিত্রের উদাহরণ, স্টেবল ডিফিউশন তারপর ক্যানভা টুল

পাখির ডানাওয়ালা গাড়িটি আমাদের সমস্ত AI-কে চ্যালেঞ্জ করেছিল, কিন্তু যে গাড়িটি উড়তে পারে সেটি ক্যানভা এবং স্টেবল ডিফিউশনকে কিছু সুন্দর বাস্তবসম্মত ভবিষ্যত রেন্ডারের সাথে আলাদা হতে দিয়েছে:

উপরের দিকে যথাক্রমে স্থিতিশীল বিস্তার এবং নীচে ক্যানভা।

অবশেষে DALL-E এর সাথে নিজেকে বেশ দক্ষ হিসেবে দেখিয়েছে ড্রাগন আকৃতির বিল্ডিং (যাহোক, যা নির্মাণাধীন রয়েছে), এবং ক্যানভা একটি প্রতিকৃতির জন্য অনুরোধটি সর্বোত্তমভাবে পূরণ করতে সক্ষম হয়েছিল যা আমরা সেলিব্রিটিকে "AI এর কল্পনা থেকে আসা একজন ব্যক্তি" দিয়ে প্রতিস্থাপন করে কিছুটা পরিবর্তন করেছি।

দুটি ক্যানভা প্রতিকৃতির পিছনে কিছু উপাদান ইমেজ প্রজন্মের পরামর্শ দেওয়া সত্ত্বেও, বাস্তবতা এখনও আকর্ষণীয়।

চূড়ান্ত গণনা, এই তাই DALL-E এবং Canva এর টুল যা যথাক্রমে 5 পয়েন্ট জিতেছে।

তারা সাধারণত বেশিরভাগ ব্যবহারকারীর অনুরোধের সাথে সামঞ্জস্য রেখে ফলাফল প্রদান করতে সক্ষম হয়।

ক্যানভা তার বাস্তবতার জন্য দাঁড়িয়েছে যখন DALL-E অনুরোধের জন্য কল্পনা বা চিত্রকলার ক্ষেত্রের প্রয়োজন হলেই আরও প্রাসঙ্গিক বলে মনে হয়।

যাইহোক, মাত্র 2 পয়েন্ট থাকা সত্ত্বেও, স্টেবল ডিফিউশন ইমেজ কোয়ালিটিতে ব্যর্থ হয় না যা এটি প্রদান করতে সক্ষম! নেতিবাচক দিকটি ব্যবহারকারীর অনুরোধ সম্পর্কে তার বোঝার মধ্যে রয়েছে কারণ তিনি প্রায়শই পৃথিবীতে খুব নিচের দিকে থাকেন। যাইহোক, এটি আবিষ্কার করা খুব আকর্ষণীয় অবশেষ।

যাইহোক, আমরা আশা করতে পারি আগামী বছরগুলিতে, কৃত্রিম বুদ্ধিমত্তার কার্যকলাপের অনেক ক্ষেত্রে বিপ্লব ঘটবে। এবং অবশ্যই দ্রুত থেকে কিছু মনে হয় আংশিক বা সম্পূর্ণভাবে AI দ্বারা লেখা বইগুলি ইতিমধ্যেই অ্যামাজনে বিক্রি হচ্ছে...বিএফএমটিভির এই সংক্ষিপ্ত ভিডিও প্রতিবেদনটি কয়েকদিন আগে এটি নিয়ে কথা হয়েছিল:

কোন মন্তব্য বা প্রশ্নের জন্য, বিষয় দেখুন forum AI নিবেদিত.

Laisser উন commentaire

Votre Adresse ডি messagerie NE Sera Pas publiée. প্রয়োজনীয় ক্ষেত্রগুলি চিহ্নিত হয় *