মোবাইল এবং ওয়েব অ্যাপগুলির জন্য, Firebase AI লজিক SDKগুলি আপনাকে সরাসরি আপনার অ্যাপ থেকে সমর্থিত জেমিনি মডেল এবং ইমেজেন মডেলগুলির সাথে ইন্টারঅ্যাক্ট করতে দেয়৷
জেমিনি মডেলগুলিকে মাল্টিমোডাল হিসাবে বিবেচনা করা হয় কারণ তারা পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও এবং অডিও সহ একাধিক পদ্ধতি প্রক্রিয়াকরণ এবং এমনকি তৈরি করতে সক্ষম। ইমেজেন মডেলগুলিকে ইমেজ তৈরি করার জন্য পাঠ্যের সাথে অনুরোধ করা যেতে পারে।
নিম্নলিখিত টেবিলটি Firebase AI লজিকের জন্য সমর্থিত মডেলগুলির একটি সংক্ষিপ্ত বিবরণ এবং তাদের সর্বশেষ স্থিতিশীল মডেলের নাম। এই টেবিলটি প্রিভিউ এবং পরীক্ষামূলক মডেলগুলিও তালিকাভুক্ত করে যা প্রোটোটাইপিং ব্যবহারের ক্ষেত্রে উপলব্ধ।
মিথুন মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ মিথুন মডেল | |||
Gemini 2.0 Flashgemini-2.0-flash-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | উচ্চতর গতি, অন্তর্নির্মিত টুল ব্যবহার এবং একটি 1M টোকেন প্রসঙ্গ উইন্ডো সহ পরবর্তী প্রজন্মের বৈশিষ্ট্য এবং উন্নত ক্ষমতা সহ আমাদের মাল্টিমোডাল মডেল |
Gemini 2.0 Flash-Litegemini-2.0-flash-lite-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের দ্রুততম এবং সবচেয়ে সাশ্রয়ী ফ্ল্যাশ মডেল। এটি 1.5 ফ্ল্যাশ ব্যবহারকারীদের জন্য একটি আপগ্রেড পাথ যারা একই দাম এবং গতিতে আরও ভাল মানের চান৷ |
শুধুমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ জেমিনি মডেল (শুধুমাত্র প্রোটোটাইপ ব্যবহারের ক্ষেত্রে প্রস্তাবিত) | |||
Gemini 2.5 Progemini-2.5-pro-preview-06-05 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের সবচেয়ে উন্নত যুক্তি মডেল, জটিল সমস্যা সমাধান করতে সক্ষম. |
মিথুন 2.5 ফ্ল্যাশgemini-2.5-flash-preview-05-20 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের চিন্তার মডেল যা দুর্দান্ত, ভাল বৃত্তাকার ক্ষমতা প্রদান করে। এটি মূল্য এবং কর্মক্ষমতার মধ্যে ভারসাম্য অফার করার জন্য ডিজাইন করা হয়েছে। |
জেমিনি 2.0 ফ্ল্যাশ ইমেজ জেনারেশনgemini-2.0-flash-preview-image-generation | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | ছবি, পাঠ্য এবং ছবি | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং ইমেজ আউটপুট সমর্থন করে। |
Gemini 2.0 Flash-Live 1gemini-2.0-flash-live-preview-04-09 | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং আউটপুটগুলির স্বল্প-বিলম্বিত রিয়েলটাইম স্ট্রিমিং সমর্থন করে। |
1 Firebase AI লজিক SDK-এর সাথে Gemini Developer API ব্যবহার করার সময় সমর্থিত নয়।
ইমেজ মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ ইমেজ মডেল | |||
চিত্র 3imagen-3.0-generate-002 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 3 দ্রুত 2imagen-3.0-fast-generate-001 | পাঠ্য | ছবি | প্রোটোটাইপিং বা কম লেটেন্সি ব্যবহারের ক্ষেত্রে ছবি তৈরি করে |
শুধুমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ ইমেজ মডেল (শুধুমাত্র প্রোটোটাইপ ব্যবহারের ক্ষেত্রে প্রস্তাবিত) | |||
চিত্র 4 2imagen-4-0-generate-preview-05-20 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 4 আল্ট্রা 2imagen-4-0-ultra-preview-05-20 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
2 এই ইমেজেন মডেলটি জেমিনি ডেভেলপার API দ্বারা সমর্থিত নয়, আপনি যেভাবে API অ্যাক্সেস করুন না কেন।
এছাড়াও, Firebase AI লজিক সমর্থন করে এবং সমর্থন করে না এমন সমস্ত মডেল সম্পর্কে আমাদের FAQ পর্যালোচনা করুন।
এই পৃষ্ঠার অবশিষ্টাংশ Firebase AI লজিক দ্বারা সমর্থিত মডেলগুলি সম্পর্কে বিস্তারিত তথ্য প্রদান করে।
- সমর্থিত ইনপুট এবং আউটপুট
- সমর্থিত ক্ষমতার উচ্চ-স্তরের তুলনা
- স্পেসিফিকেশন এবং সীমাবদ্ধতা, উদাহরণস্বরূপ সর্বোচ্চ ইনপুট টোকেন বা ইনপুট ভিডিওর সর্বোচ্চ দৈর্ঘ্য
মডেলগুলি কীভাবে সংস্করণ করা হয় তার বিবরণ, বিশেষত তাদের স্থিতিশীল , স্বয়ংক্রিয় আপডেট হওয়া , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ
আরম্ভ করার সময় আপনার কোডে অন্তর্ভুক্ত করার জন্য উপলব্ধ মডেল নামের তালিকা
মডেলের জন্য সমর্থিত ভাষার তালিকা
এই পৃষ্ঠার নীচে, আপনি পুরানো মডেল সম্পর্কে বিস্তারিত তথ্য দেখতে পারেন।
মডেল তুলনা করুন
বিভিন্ন ব্যবহারের ক্ষেত্রে সমর্থন করার জন্য প্রতিটি মডেলের বিভিন্ন ক্ষমতা রয়েছে। লক্ষ্য করুন যে এই বিভাগের প্রতিটি টেবিল প্রতিটি মডেলকে বর্ণনা করে যখন Firebase AI লজিক ব্যবহার করা হয় । প্রতিটি মডেলের অতিরিক্ত ক্ষমতা থাকতে পারে যা আমাদের SDK ব্যবহার করার সময় পাওয়া যায় না।
আপনি যদি নিম্নলিখিত উপ-বিভাগগুলিতে যে তথ্য খুঁজছেন তা খুঁজে না পান, আপনি আপনার নির্বাচিত API প্রদানকারী ডকুমেন্টেশনে আরও তথ্য পেতে পারেন:
জেমিনি ডেভেলপার এপিআই : জেমিনি মডেল এবং ইমেজেন মডেল
Vertex AI Gemini API : জেমিনি মডেল এবং ইমেজেন মডেল
সমর্থিত ইনপুট এবং আউটপুট
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ইনপুট এবং আউটপুট প্রকার:
মিথুন 2.5 প্রো | মিথুন 2.5 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ইমেজ | ||
---|---|---|---|---|---|---|---|---|
ইনপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
নথিপত্র (পিডিএফ বা প্লেইন-টেক্সট) | ||||||||
ছবি | ||||||||
ভিডিও | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) | ||||||||
আউটপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
স্ট্রাকচার্ড আউটপুট (JSON এর মত) | ||||||||
ছবি | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) |
সমর্থিত ফাইল প্রকার সম্পর্কে জানতে, সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তা দেখুন।
সমর্থিত ক্ষমতা এবং বৈশিষ্ট্য
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ক্ষমতা এবং বৈশিষ্ট্যগুলি:
মিথুন 2.5 প্রো | মিথুন 2.5 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ইমেজ | |
---|---|---|---|---|---|---|---|
শুধুমাত্র পাঠ্য বা মাল্টিমোডাল ইনপুট থেকে পাঠ্য তৈরি করুন | ইন্টারলেভড বা ইমেজের অংশ হিসাবে | শুধুমাত্র স্ট্রিমিং | |||||
ছবি তৈরি করুন ( মিথুন বা চিত্র ) | |||||||
অডিও জেনারেট করুন | শুধুমাত্র স্ট্রিমিং | ||||||
কাঠামোগত আউটপুট তৈরি করুন (JSON এর মত) | |||||||
নথি বিশ্লেষণ করুন (পিডিএফ বা প্লেইন-টেক্সট) | |||||||
ছবি বিশ্লেষণ করুন (দৃষ্টি) | |||||||
ভিডিও বিশ্লেষণ করুন (দৃষ্টি) | |||||||
অডিও বিশ্লেষণ করুন | শুধুমাত্র স্ট্রিমিং | ||||||
বহু পালা চ্যাট | |||||||
ফাংশন কলিং (সরঞ্জাম) | |||||||
টোকেন গণনা করুন | |||||||
সিস্টেম নির্দেশাবলী | |||||||
দ্বিমুখী মাল্টিমডাল স্ট্রিমিং |
স্পেসিফিকেশন এবং সীমাবদ্ধতা
ফায়ারবেস এআই লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি নির্দিষ্টকরণ এবং সীমাবদ্ধতাগুলি:
সম্পত্তি | মিথুন 2.5 প্রো | মিথুন 2.5 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ইমেজ |
---|---|---|---|---|---|---|---|
প্রসঙ্গ উইন্ডো * মোট টোকেন সীমা (সম্মিলিত ইনপুট+আউটপুট) | 1,048,576 টোকেন | 1,048,576 টোকেন | 1,048,576 টোকেন | 1,048,576 টোকেন | 32,768 টোকেন | 32,768 টোকেন | 480 টোকেন |
আউটপুট টোকেন সীমা * | 65,536 টোকেন | 65,536 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | --- |
জ্ঞান কাটঅফ তারিখ | জানুয়ারী 2025 | জানুয়ারী 2025 | জুন 2024 | জুন 2024 | আগস্ট 2024 | আগস্ট 2024 | --- |
পিডিএফ (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল ** | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | --- | --- |
সর্বোচ্চ সংখ্যা পৃষ্ঠাগুলির প্রতি ইনপুট পিডিএফ ফাইল ** | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | --- | --- |
সর্বোচ্চ আকার প্রতি ইনপুট পিডিএফ ফাইল | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | --- | --- |
ছবি (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ইমেজ | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | --- | --- |
সর্বোচ্চ সংখ্যা আউটপুট ইমেজ | --- | --- | --- | --- | 10টি ছবি | --- | 4টি ছবি |
সর্বোচ্চ আকার প্রতি ইনপুট base64-এনকোডেড চিত্র | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | --- | --- |
ভিডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ভিডিও ফাইলের | 10টি ফাইল | 10টি ফাইল | 10টি ফাইল | 10টি ফাইল | 10টি ফাইল | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (শুধুমাত্র ফ্রেম) | ~60 মিনিট | ~60 মিনিট | ~60 মিনিট | ~60 মিনিট | ~60 মিনিট | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (ফ্রেম+অডিও) | ~45 মিনিট | ~45 মিনিট | ~45 মিনিট | ~45 মিনিট | ~45 মিনিট | --- | --- |
অডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট অডিও ফাইলের | 1 ফাইল | 1 ফাইল | 1 ফাইল | 1 ফাইল | 1 ফাইল | --- | --- |
সর্বোচ্চ সংখ্যা আউটপুট অডিও ফাইলের | --- | --- | --- | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সব ইনপুট অডিও | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত আউটপুট অডিও | --- | --- | --- | --- | --- | --- | --- |
* সমস্ত মিথুন মডেলের জন্য, একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য, তাই 100টি টোকেন প্রায় 60-80টি ইংরেজি শব্দ। মিথুন মডেলের জন্য, আপনি countTokens
ব্যবহার করে আপনার অনুরোধে মোট টোকেনের সংখ্যা নির্ধারণ করতে পারেন।
** পিডিএফগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, তাই একটি পিডিএফের একক পৃষ্ঠাকে একটি চিত্র হিসাবে বিবেচনা করা হয়। একটি অনুরোধে অনুমোদিত পৃষ্ঠার সংখ্যা মডেলটি সমর্থন করতে পারে এমন চিত্রগুলির সংখ্যার মধ্যে সীমাবদ্ধ।
অতিরিক্ত বিস্তারিত তথ্য খুঁজুন
প্রতিটি মডেলের জন্য কোটা এবং মূল্য আলাদা। দাম ইনপুট এবং আউটপুট উপর নির্ভর করে.
সমর্থিত ইনপুট ফাইলের ধরন সম্পর্কে জানুন, কীভাবে MIME প্রকার নির্দিষ্ট করবেন এবং কীভাবে নিশ্চিত করবেন যে আপনার ইনপুট ফাইল এবং মাল্টিমোডাল অনুরোধগুলি প্রয়োজনীয়তাগুলি পূরণ করে এবং সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তাগুলিতে সর্বোত্তম অনুশীলনগুলি অনুসরণ করে।
মডেল সংস্করণ এবং নামকরণের ধরণ
মডেলগুলি স্থিতিশীল , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণে দেওয়া হয়। সুবিধার জন্য, স্পষ্ট সংস্করণ মান ছাড়া উপনাম সমর্থিত।
আপনার কোডে ব্যবহার করার জন্য নির্দিষ্ট মডেলের নাম খুঁজতে, এই পৃষ্ঠায় পরে "উপলভ্য মডেলের নাম" বিভাগটি দেখুন।
সংস্করণ প্রকার / মুক্তির মঞ্চ | বর্ণনা | মডেল নামের প্যাটার্ন | |
---|---|---|---|
স্থিতিশীল | স্থিতিশীল সংস্করণগুলি উপলব্ধ এবং প্রকাশের তারিখ থেকে উত্পাদন ব্যবহারের জন্য সমর্থিত। একটি স্থিতিশীল মডেল সংস্করণ সাধারণত অবসর গ্রহণের তারিখের সাথে প্রকাশ করা হয়, যা শেষ দিনটি নির্দেশ করে যে মডেলটি উপলব্ধ। এই তারিখের পরে, মডেলটি আর অ্যাক্সেসযোগ্য বা Google দ্বারা সমর্থিত নয়৷ | স্থিতিশীল সংস্করণগুলির মডেল নামগুলি একটি নির্দিষ্ট তিন-সংখ্যার সংস্করণ নম্বরের সাথে যুক্ত করা হয় উদাহরণ: | |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | স্বতঃ-আপডেট করা স্থিতিশীল উপনামগুলি সর্বদা সেই মডেলের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে৷ যদি একটি নতুন স্থিতিশীল সংস্করণ প্রকাশিত হয়, স্বয়ংক্রিয়ভাবে আপডেট হওয়া উপনাম স্বয়ংক্রিয়ভাবে সেই নতুন স্থিতিশীল সংস্করণের দিকে নির্দেশ করা শুরু করে। | উপনামের মডেল নামের কোন উপাঙ্গ নেই উদাহরণ: | |
পূর্বরূপ | পূর্বরূপ সংস্করণে নতুন ক্ষমতা রয়েছে এবং স্থিতিশীল নয় বলে মনে করা হয়। পূর্বরূপ সংস্করণগুলি সর্বদা সেই মডেলের সর্বশেষ পূর্বরূপ সংস্করণের দিকে নির্দেশ করে৷ যদি একটি নতুন প্রিভিউ সংস্করণ প্রকাশিত হয়, তবে বিদ্যমান পূর্বরূপ সংস্করণটি স্বয়ংক্রিয়ভাবে সেই নতুন পূর্বরূপ সংস্করণের দিকে নির্দেশ করতে শুরু করে। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না , আরও সীমাবদ্ধ হারের সীমা সহ আসে এবং বিলিং প্রয়োজনীয়তা থাকতে পারে। | পূর্বরূপ সংস্করণের মডেল নাম এর সাথে যুক্ত করা হয়েছে
| |
পরীক্ষামূলক | পরীক্ষামূলক সংস্করণে নতুন ক্ষমতা রয়েছে এবং স্থিতিশীল নয় বলে মনে করা হয়। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না এবং আরও সীমাবদ্ধ হারের সীমা সহ আসে। পরীক্ষামূলক মডেলগুলি প্রতিক্রিয়া সংগ্রহের জন্য এবং আমাদের সাম্প্রতিক বৈশিষ্ট্যগুলির সাথে পরীক্ষা সক্ষম করার উদ্দেশ্যে তৈরি করা হয়েছে৷ | পরীক্ষামূলক সংস্করণের মডেল নাম এর সাথে যুক্ত করা হয়েছে
| |
অবসরপ্রাপ্ত | অবসরপ্রাপ্ত সংস্করণগুলি তাদের অবসর গ্রহণের তারিখ অতিক্রম করেছে এবং স্থায়ীভাবে নিষ্ক্রিয় করা হয়েছে৷ অবসরপ্রাপ্ত মডেলগুলি আর Google দ্বারা অ্যাক্সেসযোগ্য বা সমর্থিত নয়৷ একটি অবসরপ্রাপ্ত মডেল আইডি উল্লেখ করার অনুরোধগুলি সাধারণত একটি 404 ত্রুটি প্রদান করে। | --- |
উপলব্ধ মডেল নাম
মডেলের নামগুলি হল সুস্পষ্ট মান যা আপনি মডেলের শুরু করার সময় আপনার কোডে অন্তর্ভুক্ত করেন।
প্রোগ্রামগতভাবে সমস্ত উপলব্ধ মডেল তালিকা
আপনি REST API ব্যবহার করে সমস্ত উপলব্ধ মডেলের নাম তালিকাভুক্ত করতে পারেন:
জেমিনি ডেভেলপার API :
models.list
এন্ডপয়েন্টে কল করুনVertex AI Gemini API :
publishers.models.list
এন্ডপয়েন্টে কল করুন
মনে রাখবেন যে এই প্রত্যাবর্তিত তালিকায় API প্রদানকারীদের দ্বারা সমর্থিত সমস্ত মডেল অন্তর্ভুক্ত থাকবে, কিন্তু Firebase AI লজিক শুধুমাত্র এই পৃষ্ঠায় বর্ণিত জেমিনি এবং ইমেজেন মডেলগুলিকে সমর্থন করে৷ এছাড়াও মনে রাখবেন যে স্বয়ংক্রিয়-আপডেট করা উপনামগুলি (উদাহরণস্বরূপ, gemini-2.0-flash
) তালিকাভুক্ত নয় কারণ সেগুলি বেস মডেলের জন্য একটি সুবিধাজনক উপনাম৷
মিথুন মডেলের নাম
আপনার প্ল্যাটফর্মের জন্য প্রাথমিক উদাহরণের জন্য, শুরু করার নির্দেশিকা দেখুন।
প্রকাশের পর্যায়গুলি সম্পর্কে বিশদ বিবরণের জন্য (বিশেষ করে ব্যবহারের ক্ষেত্রে এবং বিলিং এর জন্য), মডেল সংস্করণ এবং নামকরণের ধরণগুলি দেখুন।
Gemini 2.5 Pro মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.5-pro-preview-06-05 | Gemini 2.5 Pro এর সর্বশেষ প্রিভিউ সংস্করণ | পূর্বরূপ | 2025-06-05 | নির্ধারণ করা |
gemini-2.5-pro-preview-05-06 | Gemini 2.5 Pro এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-06 | নির্ধারণ করা |
gemini-2.5-pro-preview-03-25 | পূর্বরূপ সংস্করণ নির্দেশ করেgemini-2.5-pro-preview-05-06 | পূর্বরূপ | 2025-03-25 | নির্ধারণ করা |
Gemini 2.5 Flash মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.5-flash-preview-05-20 | জেমিনি 2.5 ফ্ল্যাশের সর্বশেষ পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-20 | নির্ধারণ করা |
gemini-2.5-flash-preview-04-17 | জেমিনি 2.5 ফ্ল্যাশের প্রাথমিক পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-04-17 | নির্ধারণ করা |
জেমিনি 2.0 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-001 | জেমিনি 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-05 | এর আগে নয় 2026-02-05 |
gemini-2.0-flash | 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে স্বয়ংক্রিয়-আপডেট করা উপনাম (বর্তমানে gemini-2.0-flash-001 ) | স্থিতিশীল | 2025-02-10 | --- |
Gemini 2.0 Flash-Lite মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Gemini 2.0 Flash-Lite- এর সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-25 | এর আগে নয় 2026-02-25 |
gemini-2.0-flash-lite | 2.0 ফ্ল্যাশ-লাইটের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে স্বয়ংক্রিয়-আপডেট করা উপনাম৷ (বর্তমানে gemini-2.0-flash-lite-001 ) | স্থিতিশীল | 2025-02-25 | --- |
জেমিনি 2.0 ফ্ল্যাশ ইমেজ জেনারেশন মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 | জেমিনি 2.0 ফ্ল্যাশ ইমেজ জেনারেশনের পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-06 | নির্ধারণ করা |
Gemini 2.0 Flash-Live মডেলের নাম
আপনার API প্রদানকারী হিসাবে Vertex AI Gemini API ব্যবহার করার সময় শুধুমাত্র উপলব্ধ। |
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 | Gemini 2.0 Flash-Live- এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-04-09 | নির্ধারণ করা |
1 Firebase AI লজিক SDK-এর সাথে Gemini Developer API ব্যবহার করার সময় সমর্থিত নয়।
ইমেজ মডেল নাম
আপনার প্ল্যাটফর্মের জন্য আরম্ভ করার উদাহরণের জন্য, ইমেজেন গাইডের সাহায্যে ছবি তৈরি করুন দেখুন।
প্রকাশের পর্যায়গুলি সম্পর্কে বিশদ বিবরণের জন্য (বিশেষ করে ব্যবহারের ক্ষেত্রে এবং বিলিং এর জন্য), মডেল সংস্করণ এবং নামকরণের ধরণগুলি দেখুন।
ইমেজ 4 মডেল নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-4-0-generate-preview-05-20 2 | Imagen 4 এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-20 | নির্ধারণ করা |
চিত্র 4 আল্ট্রা মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-4.0-ultra-generate-exp-05-20 2 | Imagen 4 Ultra এর পরীক্ষামূলক সংস্করণ | পূর্বরূপ | 2025-05-20 | নির্ধারণ করা |
ইমেজ 3 মডেল নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-3.0-generate-002 | Imagen 3 এর সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-01-23 | 2026-01-23 এর আগে নয় |
imagen-3.0-generate-001 2 | Imagen 3 এর প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে নয় |
চিত্র 3 দ্রুত মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 | Imagen 3 ফাস্টের প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে নয় |
2 আপনি যেভাবে API অ্যাক্সেস করেন না কেন জেমিনি ডেভেলপার API দ্বারা সমর্থিত নয়৷
সমর্থিত ভাষা
মিথুন
সমস্ত মিথুন মডেল নিম্নলিখিত ভাষায় বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
আরবি (আরবি), বাংলা (বিএন), বুলগেরিয়ান (বিজি), চাইনিজ সরলীকৃত এবং ঐতিহ্যবাহী (zh), ক্রোয়েশিয়ান (hr), চেক (cs), ডেনিশ (da), ডাচ (nl), ইংরেজি (en), এস্তোনিয়ান (et), ফিনিশ (fi), ফ্রেঞ্চ (fr), জার্মান (de), গ্রীক (el), হিব্রু (iw), হিন্দি (hi), হাঙ্গেরিয়ান (hu), কোরিয়া (hu), কোরিয়া (হু), কোরিয়া (ইন্দো), জাপানি (ইংরেজি) লাটভিয়ান (lv), লিথুয়ানিয়ান (lt), নরওয়েজিয়ান (no), পোলিশ (pl), পর্তুগিজ (pt), রোমানিয়ান (ro), রাশিয়ান (ru), সার্বিয়ান (sr), স্লোভাক (sk), স্লোভেনিয়ান (sl), স্প্যানিশ (es), সোয়াহিলি (sw), সুইডিশ (sv), থাই (th), তুর্কি (tr), ইউক্রেনীয় (ইউক্রেনীয়)
জেমিনি 2.0 ফ্ল্যাশ , জেমিনি 1.5 প্রো এবং জেমিনি 1.5 ফ্ল্যাশ মডেলগুলি নিম্নলিখিত অতিরিক্ত ভাষায় বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
Afrikaans (af), আমহারিক (am), অসমীয়া (as), আজারবাইজানীয় (az), বেলারুশিয়ান (be), বসনিয়ান (bs), কাতালান (ca), Cebuano (ceb), কর্সিকান (co), ওয়েলশ (cy), দিভেহি (dv), এস্পেরান্তো (eo), বাস্ক (eu), ফার্সি (fa), ফিলিপিনো (তাগালগ (ইউ), ফিলিপিনো (তাগালগ (ইউ), ফিলিপিনো (তাগালগ) (gd), গ্যালিসিয়ান (gl), গুজরাটি (gu), হাউসা (ha), হাওয়াইয়ান (haw), Hmong (hmn), হাইতিয়ান ক্রেওল (ht), আর্মেনিয়ান (hy), ইগবো (ig), আইসল্যান্ডিক (is), জাভানিজ (jv), জর্জিয়ান (ka), কাজাখ (kk), খেমার (km), Kannada (knrnishkriyz), লাকরিও (kn) (kn) (la), লুক্সেমবার্গিশ (lb), লাও (lo), মালাগাসি (mg), মাওরি (mi), ম্যাসেডোনিয়ান (mk), মালায়ালাম (ml), মঙ্গোলিয়ান (mn), Meiteilon (মণিপুরি) (mni-Mtei), মারাঠি (mr), মালয় (ms), মাল্টিজ (mt), মায়ানমার (Burmese), নেপালী (Burmese), নেপালী (mn) ওড়িয়া (ওড়িয়া) (বা), পাঞ্জাবি (পা), পশতু (পিএস), সিন্ধি (এসডি), সিংহলা (সিংহলি) (সি), সামোয়ান (এসএম), শোনা (এসএন), সোমালি (সো), আলবেনিয়ান (বর্গ), সেসোথো (স্ট), সুদানিজ (সু), তামিল (তা), তেলুগু (টে), তাজিক (টিজি), উজুরুকু (উর্দু), উর্দু (উইজিউর) (xh), ইদ্দিশ (yi), ইওরুবা (yo), জুলু (zu)
ইমেজ
সাধারণ উপলব্ধতা : ইংরেজি
পূর্বরূপ : চাইনিজ (সরলীকৃত), চাইনিজ (প্রথাগত), হিন্দি, জাপানিজ, কোরিয়ান, পর্তুগিজ, স্প্যানিশ
পুরানো মডেল সম্পর্কে তথ্য
ফায়ারবেস এআই লজিক পুরোনো সক্রিয় জেমিনি মডেলগুলিকে সমর্থন করে (যেমন জেমিনি 1.5 মডেল)।
ফায়ারবেস এআই লজিক পুরানো ইমেজেন মডেলগুলিকে সমর্থন করে না (যেমন ইমেজেন 2 )।
মডেল | ইনপুট | আউটপুট | জন্য অপ্টিমাইজ করা হয়েছে |
---|---|---|---|
মিথুন 1.5 প্রোgemini-1.5-pro-002 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আরো বুদ্ধিমত্তা প্রয়োজন জটিল যুক্তি কাজ সমর্থন করে; 2M দীর্ঘ প্রসঙ্গ |
মিথুন 1.5 ফ্ল্যাশgemini-1.5-flash-002 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | বিভিন্ন ধরনের কাজ জুড়ে দ্রুত এবং বহুমুখী কর্মক্ষমতা অফার করে |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
পরবর্তী পদক্ষেপ
জেমিনি API- এর ক্ষমতা ব্যবহার করে দেখুন
- মাল্টি-টার্ন কথোপকথন তৈরি করুন (চ্যাট) ।
- শুধুমাত্র পাঠ্য প্রম্পট থেকে পাঠ্য তৈরি করুন।
- ছবি , পিডিএফ , ভিডিও এবং অডিওর মতো বিভিন্ন ধরনের ফাইল প্রম্পট করে পাঠ্য তৈরি করুন।
- টেক্সট এবং মাল্টিমোডাল প্রম্পট উভয় থেকে কাঠামোগত আউটপুট (যেমন JSON) তৈরি করুন।
- টেক্সট প্রম্পট ( মিথুন বা ইমেজেন ) থেকে ছবি তৈরি করুন।
- Gemini Live API ব্যবহার করে স্ট্রিম ইনপুট এবং আউটপুট (অডিও সহ)।
- বাহ্যিক সিস্টেম এবং তথ্যের সাথে জেনারেটিভ মডেল সংযোগ করতে ফাংশন কলিং ব্যবহার করুন।
মোবাইল এবং ওয়েব অ্যাপগুলির জন্য, Firebase AI লজিক SDKগুলি আপনাকে সরাসরি আপনার অ্যাপ থেকে সমর্থিত জেমিনি মডেল এবং ইমেজেন মডেলগুলির সাথে ইন্টারঅ্যাক্ট করতে দেয়৷
জেমিনি মডেলগুলিকে মাল্টিমোডাল হিসাবে বিবেচনা করা হয় কারণ তারা পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও এবং অডিও সহ একাধিক পদ্ধতি প্রক্রিয়াকরণ এবং এমনকি তৈরি করতে সক্ষম। ইমেজেন মডেলগুলিকে ইমেজ তৈরি করার জন্য পাঠ্যের সাথে অনুরোধ করা যেতে পারে।
নিম্নলিখিত টেবিলটি Firebase AI লজিকের জন্য সমর্থিত মডেলগুলির একটি সংক্ষিপ্ত বিবরণ এবং তাদের সর্বশেষ স্থিতিশীল মডেলের নাম। এই টেবিলটি প্রিভিউ এবং পরীক্ষামূলক মডেলগুলিও তালিকাভুক্ত করে যা প্রোটোটাইপিং ব্যবহারের ক্ষেত্রে উপলব্ধ।
মিথুন মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ মিথুন মডেল | |||
Gemini 2.0 Flashgemini-2.0-flash-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | উচ্চতর গতি, অন্তর্নির্মিত টুল ব্যবহার এবং একটি 1M টোকেন প্রসঙ্গ উইন্ডো সহ পরবর্তী প্রজন্মের বৈশিষ্ট্য এবং উন্নত ক্ষমতা সহ আমাদের মাল্টিমোডাল মডেল |
Gemini 2.0 Flash-Litegemini-2.0-flash-lite-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের দ্রুততম এবং সবচেয়ে সাশ্রয়ী ফ্ল্যাশ মডেল। এটি 1.5 ফ্ল্যাশ ব্যবহারকারীদের জন্য একটি আপগ্রেড পাথ যারা একই দাম এবং গতিতে আরও ভাল মানের চান৷ |
শুধুমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ জেমিনি মডেল (শুধুমাত্র প্রোটোটাইপ ব্যবহারের ক্ষেত্রে প্রস্তাবিত) | |||
Gemini 2.5 Progemini-2.5-pro-preview-06-05 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের সবচেয়ে উন্নত যুক্তি মডেল, জটিল সমস্যা সমাধান করতে সক্ষম. |
মিথুন 2.5 ফ্ল্যাশgemini-2.5-flash-preview-05-20 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের চিন্তার মডেল যা দুর্দান্ত, ভাল বৃত্তাকার ক্ষমতা প্রদান করে। এটি মূল্য এবং কর্মক্ষমতার মধ্যে ভারসাম্য অফার করার জন্য ডিজাইন করা হয়েছে। |
জেমিনি 2.0 ফ্ল্যাশ ইমেজ জেনারেশনgemini-2.0-flash-preview-image-generation | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | ছবি, পাঠ্য এবং ছবি | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং ইমেজ আউটপুট সমর্থন করে। |
Gemini 2.0 Flash-Live 1gemini-2.0-flash-live-preview-04-09 | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং আউটপুটগুলির স্বল্প-বিলম্বিত রিয়েলটাইম স্ট্রিমিং সমর্থন করে। |
1 Firebase AI লজিক SDK-এর সাথে Gemini Developer API ব্যবহার করার সময় সমর্থিত নয়।
ইমেজ মডেল
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ ইমেজ মডেল | |||
চিত্র 3imagen-3.0-generate-002 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 3 দ্রুত 2imagen-3.0-fast-generate-001 | পাঠ্য | ছবি | প্রোটোটাইপিং বা কম লেটেন্সি ব্যবহারের ক্ষেত্রে ছবি তৈরি করে |
শুধুমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ ইমেজ মডেল (শুধুমাত্র প্রোটোটাইপ ব্যবহারের ক্ষেত্রে প্রস্তাবিত) | |||
চিত্র 4 2imagen-4-0-generate-preview-05-20 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 4 আল্ট্রা 2imagen-4-0-ultra-preview-05-20 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
2 এই ইমেজেন মডেলটি জেমিনি ডেভেলপার API দ্বারা সমর্থিত নয়, আপনি যেভাবে API অ্যাক্সেস করুন না কেন।
এছাড়াও, Firebase AI লজিক সমর্থন করে এবং সমর্থন করে না এমন সমস্ত মডেল সম্পর্কে আমাদের FAQ পর্যালোচনা করুন।
এই পৃষ্ঠার অবশিষ্টাংশ Firebase AI লজিক দ্বারা সমর্থিত মডেলগুলি সম্পর্কে বিস্তারিত তথ্য প্রদান করে।
- সমর্থিত ইনপুট এবং আউটপুট
- সমর্থিত ক্ষমতার উচ্চ-স্তরের তুলনা
- স্পেসিফিকেশন এবং সীমাবদ্ধতা, উদাহরণস্বরূপ সর্বোচ্চ ইনপুট টোকেন বা ইনপুট ভিডিওর সর্বোচ্চ দৈর্ঘ্য
মডেলগুলি কীভাবে সংস্করণ করা হয় তার বিবরণ, বিশেষত তাদের স্থিতিশীল , স্বয়ংক্রিয় আপডেট হওয়া , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ
আরম্ভ করার সময় আপনার কোডে অন্তর্ভুক্ত করার জন্য উপলব্ধ মডেল নামের তালিকা
মডেলের জন্য সমর্থিত ভাষার তালিকা
এই পৃষ্ঠার নীচে, আপনি পুরানো মডেল সম্পর্কে বিস্তারিত তথ্য দেখতে পারেন।
মডেল তুলনা করুন
বিভিন্ন ব্যবহারের ক্ষেত্রে সমর্থন করার জন্য প্রতিটি মডেলের বিভিন্ন ক্ষমতা রয়েছে। লক্ষ্য করুন যে এই বিভাগের প্রতিটি টেবিল প্রতিটি মডেলকে বর্ণনা করে যখন Firebase AI লজিক ব্যবহার করা হয় । প্রতিটি মডেলের অতিরিক্ত ক্ষমতা থাকতে পারে যা আমাদের SDK ব্যবহার করার সময় পাওয়া যায় না।
আপনি যদি নিম্নলিখিত উপ-বিভাগগুলিতে যে তথ্য খুঁজছেন তা খুঁজে না পান, আপনি আপনার নির্বাচিত API প্রদানকারী ডকুমেন্টেশনে আরও তথ্য পেতে পারেন:
জেমিনি ডেভেলপার এপিআই : জেমিনি মডেল এবং ইমেজেন মডেল
Vertex AI Gemini API : জেমিনি মডেল এবং ইমেজেন মডেল
সমর্থিত ইনপুট এবং আউটপুট
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ইনপুট এবং আউটপুট প্রকার:
মিথুন 2.5 প্রো | মিথুন 2.5 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ইমেজ | ||
---|---|---|---|---|---|---|---|---|
ইনপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
নথিপত্র (পিডিএফ বা প্লেইন-টেক্সট) | ||||||||
ছবি | ||||||||
ভিডিও | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) | ||||||||
আউটপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
স্ট্রাকচার্ড আউটপুট (JSON এর মত) | ||||||||
ছবি | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) |
সমর্থিত ফাইল প্রকার সম্পর্কে জানতে, সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তা দেখুন।
সমর্থিত ক্ষমতা এবং বৈশিষ্ট্য
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ক্ষমতা এবং বৈশিষ্ট্যগুলি:
মিথুন 2.5 প্রো | মিথুন 2.5 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ইমেজ | |
---|---|---|---|---|---|---|---|
শুধুমাত্র পাঠ্য বা মাল্টিমোডাল ইনপুট থেকে পাঠ্য তৈরি করুন | ইন্টারলেভড বা ইমেজের অংশ হিসাবে | শুধুমাত্র স্ট্রিমিং | |||||
ছবি তৈরি করুন ( মিথুন বা চিত্র ) | |||||||
অডিও জেনারেট করুন | শুধুমাত্র স্ট্রিমিং | ||||||
কাঠামোগত আউটপুট তৈরি করুন (JSON এর মত) | |||||||
নথি বিশ্লেষণ করুন (পিডিএফ বা প্লেইন-টেক্সট) | |||||||
ছবি বিশ্লেষণ করুন (দৃষ্টি) | |||||||
ভিডিও বিশ্লেষণ করুন (দৃষ্টি) | |||||||
অডিও বিশ্লেষণ করুন | শুধুমাত্র স্ট্রিমিং | ||||||
বহু পালা চ্যাট | |||||||
ফাংশন কলিং (সরঞ্জাম) | |||||||
টোকেন গণনা করুন | |||||||
সিস্টেম নির্দেশাবলী | |||||||
দ্বিমুখী মাল্টিমডাল স্ট্রিমিং |
স্পেসিফিকেশন এবং সীমাবদ্ধতা
ফায়ারবেস এআই লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি নির্দিষ্টকরণ এবং সীমাবদ্ধতাগুলি:
সম্পত্তি | মিথুন 2.5 প্রো | মিথুন 2.5 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ইমেজ |
---|---|---|---|---|---|---|---|
প্রসঙ্গ উইন্ডো * মোট টোকেন সীমা (সম্মিলিত ইনপুট+আউটপুট) | 1,048,576 টোকেন | 1,048,576 টোকেন | 1,048,576 টোকেন | 1,048,576 টোকেন | 32,768 টোকেন | 32,768 টোকেন | 480 টোকেন |
আউটপুট টোকেন সীমা * | 65,536 টোকেন | 65,536 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | 8,192 টোকেন | --- |
জ্ঞান কাটঅফ তারিখ | জানুয়ারী 2025 | জানুয়ারী 2025 | জুন 2024 | জুন 2024 | আগস্ট 2024 | আগস্ট 2024 | --- |
পিডিএফ (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল ** | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | --- | --- |
সর্বোচ্চ সংখ্যা পৃষ্ঠাগুলির প্রতি ইনপুট পিডিএফ ফাইল ** | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | --- | --- |
সর্বোচ্চ আকার প্রতি ইনপুট পিডিএফ ফাইল | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | --- | --- |
ছবি (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ইমেজ | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | --- | --- |
সর্বোচ্চ সংখ্যা আউটপুট ইমেজ | --- | --- | --- | --- | 10টি ছবি | --- | 4টি ছবি |
সর্বোচ্চ আকার প্রতি ইনপুট base64-এনকোডেড চিত্র | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | --- | --- |
ভিডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ভিডিও ফাইলের | 10টি ফাইল | 10টি ফাইল | 10টি ফাইল | 10টি ফাইল | 10টি ফাইল | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (শুধু ফ্রেম) | ~60 মিনিট | ~60 মিনিট | ~60 মিনিট | ~60 মিনিট | ~60 মিনিট | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (ফ্রেম+অডিও) | ~45 মিনিট | ~45 মিনিট | ~45 মিনিট | ~45 মিনিট | ~45 মিনিট | --- | --- |
অডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট অডিও ফাইলের | 1 ফাইল | 1 ফাইল | 1 ফাইল | 1 ফাইল | 1 ফাইল | --- | --- |
সর্বোচ্চ সংখ্যা আউটপুট অডিও ফাইলের | --- | --- | --- | --- | --- | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সব ইনপুট অডিও | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | --- | --- |
সর্বোচ্চ দৈর্ঘ্য সমস্ত আউটপুট অডিও | --- | --- | --- | --- | --- | --- | --- |
* সমস্ত মিথুন মডেলের জন্য, একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য, তাই 100টি টোকেন প্রায় 60-80টি ইংরেজি শব্দ। মিথুন মডেলের জন্য, আপনি countTokens
ব্যবহার করে আপনার অনুরোধে মোট টোকেনের সংখ্যা নির্ধারণ করতে পারেন।
** পিডিএফগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, তাই একটি পিডিএফের একক পৃষ্ঠাকে একটি চিত্র হিসাবে বিবেচনা করা হয়। একটি অনুরোধে অনুমোদিত পৃষ্ঠার সংখ্যা মডেলটি সমর্থন করতে পারে এমন চিত্রগুলির সংখ্যার মধ্যে সীমাবদ্ধ।
অতিরিক্ত বিস্তারিত তথ্য খুঁজুন
প্রতিটি মডেলের জন্য কোটা এবং মূল্য আলাদা। দাম ইনপুট এবং আউটপুট উপর নির্ভর করে.
সমর্থিত ইনপুট ফাইলের ধরন সম্পর্কে জানুন, কীভাবে MIME প্রকার নির্দিষ্ট করবেন এবং কীভাবে নিশ্চিত করবেন যে আপনার ইনপুট ফাইল এবং মাল্টিমোডাল অনুরোধগুলি প্রয়োজনীয়তাগুলি পূরণ করে এবং সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তাগুলিতে সর্বোত্তম অনুশীলনগুলি অনুসরণ করে।
মডেল সংস্করণ এবং নামকরণের ধরণ
মডেলগুলি স্থিতিশীল , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণে দেওয়া হয়। সুবিধার জন্য, স্পষ্ট সংস্করণ মান ছাড়া উপনাম সমর্থিত।
আপনার কোডে ব্যবহার করার জন্য নির্দিষ্ট মডেলের নাম খুঁজতে, এই পৃষ্ঠায় পরে "উপলভ্য মডেলের নাম" বিভাগটি দেখুন।
সংস্করণ প্রকার / মুক্তির মঞ্চ | বর্ণনা | মডেল নামের প্যাটার্ন | |
---|---|---|---|
স্থিতিশীল | স্থিতিশীল সংস্করণগুলি উপলব্ধ এবং প্রকাশের তারিখ থেকে উত্পাদন ব্যবহারের জন্য সমর্থিত। একটি স্থিতিশীল মডেল সংস্করণ সাধারণত অবসর গ্রহণের তারিখের সাথে প্রকাশ করা হয়, যা শেষ দিনটি নির্দেশ করে যে মডেলটি উপলব্ধ। এই তারিখের পরে, মডেলটি আর অ্যাক্সেসযোগ্য বা Google দ্বারা সমর্থিত নয়৷ | স্থিতিশীল সংস্করণগুলির মডেল নামগুলি একটি নির্দিষ্ট তিন-সংখ্যার সংস্করণ নম্বরের সাথে যুক্ত করা হয় উদাহরণ: | |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | স্বতঃ-আপডেট করা স্থিতিশীল উপনামগুলি সর্বদা সেই মডেলের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে৷ যদি একটি নতুন স্থিতিশীল সংস্করণ প্রকাশিত হয়, স্বয়ংক্রিয়ভাবে আপডেট হওয়া উপনাম স্বয়ংক্রিয়ভাবে সেই নতুন স্থিতিশীল সংস্করণের দিকে নির্দেশ করা শুরু করে। | উপনামের মডেল নামের কোন উপাঙ্গ নেই উদাহরণ: | |
পূর্বরূপ | পূর্বরূপ সংস্করণে নতুন ক্ষমতা রয়েছে এবং স্থিতিশীল নয় বলে মনে করা হয়। পূর্বরূপ সংস্করণগুলি সর্বদা সেই মডেলের সর্বশেষ পূর্বরূপ সংস্করণের দিকে নির্দেশ করে৷ যদি একটি নতুন প্রিভিউ সংস্করণ প্রকাশিত হয়, তবে বিদ্যমান পূর্বরূপ সংস্করণটি স্বয়ংক্রিয়ভাবে সেই নতুন পূর্বরূপ সংস্করণের দিকে নির্দেশ করতে শুরু করে। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না , আরও সীমাবদ্ধ হারের সীমা সহ আসে এবং বিলিং প্রয়োজনীয়তা থাকতে পারে। | পূর্বরূপ সংস্করণের মডেল নাম এর সাথে যুক্ত করা হয়েছে
| |
পরীক্ষামূলক | পরীক্ষামূলক সংস্করণে নতুন ক্ষমতা রয়েছে এবং স্থিতিশীল নয় বলে মনে করা হয়। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না এবং আরও সীমাবদ্ধ হারের সীমা সহ আসে। পরীক্ষামূলক মডেলগুলি প্রতিক্রিয়া সংগ্রহের জন্য এবং আমাদের সাম্প্রতিক বৈশিষ্ট্যগুলির সাথে পরীক্ষা সক্ষম করার উদ্দেশ্যে তৈরি করা হয়েছে৷ | পরীক্ষামূলক সংস্করণের মডেল নাম এর সাথে যুক্ত করা হয়েছে
| |
অবসরপ্রাপ্ত | অবসরপ্রাপ্ত সংস্করণগুলি তাদের অবসর গ্রহণের তারিখ অতিক্রম করেছে এবং স্থায়ীভাবে নিষ্ক্রিয় করা হয়েছে৷ অবসরপ্রাপ্ত মডেলগুলি আর Google দ্বারা অ্যাক্সেসযোগ্য বা সমর্থিত নয়৷ একটি অবসরপ্রাপ্ত মডেল আইডি উল্লেখ করার অনুরোধগুলি সাধারণত একটি 404 ত্রুটি প্রদান করে। | --- |
উপলব্ধ মডেল নাম
মডেলের নামগুলি হল সুস্পষ্ট মান যা আপনি মডেলের শুরু করার সময় আপনার কোডে অন্তর্ভুক্ত করেন।
প্রোগ্রামগতভাবে সমস্ত উপলব্ধ মডেল তালিকা
আপনি REST API ব্যবহার করে সমস্ত উপলব্ধ মডেলের নাম তালিকাভুক্ত করতে পারেন:
জেমিনি ডেভেলপার API :
models.list
এন্ডপয়েন্টে কল করুনVertex AI Gemini API :
publishers.models.list
এন্ডপয়েন্টে কল করুন
মনে রাখবেন যে এই প্রত্যাবর্তিত তালিকায় API প্রদানকারীদের দ্বারা সমর্থিত সমস্ত মডেল অন্তর্ভুক্ত থাকবে, কিন্তু Firebase AI লজিক শুধুমাত্র এই পৃষ্ঠায় বর্ণিত জেমিনি এবং ইমেজেন মডেলগুলিকে সমর্থন করে৷ এছাড়াও মনে রাখবেন যে স্বয়ংক্রিয়-আপডেট করা উপনামগুলি (উদাহরণস্বরূপ, gemini-2.0-flash
) তালিকাভুক্ত নয় কারণ সেগুলি বেস মডেলের জন্য একটি সুবিধাজনক উপনাম৷
মিথুন মডেলের নাম
আপনার প্ল্যাটফর্মের জন্য প্রাথমিক উদাহরণের জন্য, শুরু করার নির্দেশিকা দেখুন।
প্রকাশের পর্যায়গুলি সম্পর্কে বিশদ বিবরণের জন্য (বিশেষ করে ব্যবহারের ক্ষেত্রে এবং বিলিং এর জন্য), মডেল সংস্করণ এবং নামকরণের ধরণগুলি দেখুন।
Gemini 2.5 Pro মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.5-pro-preview-06-05 | Gemini 2.5 Pro এর সর্বশেষ প্রিভিউ সংস্করণ | পূর্বরূপ | 2025-06-05 | নির্ধারণ করা |
gemini-2.5-pro-preview-05-06 | Gemini 2.5 Pro এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-06 | নির্ধারণ করা |
gemini-2.5-pro-preview-03-25 | পূর্বরূপ সংস্করণ নির্দেশ করছেgemini-2.5-pro-preview-05-06 | পূর্বরূপ | 2025-03-25 | নির্ধারণ করা |
মিথুন 2.5 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | প্রকাশের পর্যায়ে | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.5-flash-preview-05-20 | জেমিনি 2.5 ফ্ল্যাশের সর্বশেষ পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-20 | নির্ধারণ করা |
gemini-2.5-flash-preview-04-17 | জেমিনি 2.5 ফ্ল্যাশের প্রাথমিক পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-04-17 | নির্ধারণ করা |
মিথুন 2.0 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | প্রকাশের পর্যায়ে | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-001 | জেমিনি 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-05 | এর আগে আর নেই 2026-02-05 |
gemini-2.0-flash | অটো-আপডেটেড ওরফে 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণটির দিকে ইঙ্গিত করে (বর্তমানে gemini-2.0-flash-001 ) | স্থিতিশীল | 2025-02-10 | --- |
মিথুন 2.0 ফ্ল্যাশ - লাইট মডেলের নাম
মডেলের নাম | বর্ণনা | প্রকাশের পর্যায়ে | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | জেমিনি 2.0 ফ্ল্যাশ - লাইটের সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-25 | এর আগে আর নেই 2026-02-25 |
gemini-2.0-flash-lite | 2.0 ফ্ল্যাশ-লাইটের সর্বশেষতম স্থিতিশীল সংস্করণটির দিকে ইঙ্গিত করে অটো-আপডেটেড ওরফে (বর্তমানে gemini-2.0-flash-lite-001 ) | স্থিতিশীল | 2025-02-25 | --- |
মিথুন 2.0 ফ্ল্যাশ ইমেজ জেনারেশন মডেল নাম
মডেলের নাম | বর্ণনা | প্রকাশের পর্যায়ে | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 | জেমিনি 2.0 ফ্ল্যাশ চিত্র প্রজন্মের জন্য পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-06 | নির্ধারণ করা |
মিথুন 2.0 ফ্ল্যাশ - প্রাণীর মডেল নাম
আপনার এপিআই সরবরাহকারী হিসাবে ভার্টেক্স এআই জেমিনি এপিআই ব্যবহার করার সময় কেবল উপলব্ধ। |
মডেলের নাম | বর্ণনা | প্রকাশের পর্যায়ে | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 | জেমিনি 2.0 ফ্ল্যাশ -লাইভের জন্য পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-04-09 | নির্ধারণ করা |
1 জেমিনি বিকাশকারী এপিআই ফায়ারবেস এআই লজিক এসডিকেএস সহ ব্যবহার করার সময় সমর্থিত নয়।
ইমেজ মডেল নাম
আপনার প্ল্যাটফর্মের জন্য সূচনা উদাহরণগুলির জন্য, ইমেজেন গাইড সহ উত্পন্ন চিত্রগুলি দেখুন।
রিলিজের পর্যায়ে (বিশেষত ব্যবহারের ক্ষেত্রে এবং বিলিংয়ের জন্য) সম্পর্কে বিশদগুলির জন্য, মডেল সংস্করণ এবং নামকরণের নিদর্শনগুলি দেখুন।
4 মডেলের নাম ইমেজ করুন
মডেলের নাম | বর্ণনা | প্রকাশের পর্যায়ে | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-4-0-generate-preview-05-20 2 | ইমেজেন 4 এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-20 | নির্ধারণ করা |
4 আল্ট্রা মডেলের নাম ইমেজ করুন
মডেলের নাম | বর্ণনা | প্রকাশের পর্যায়ে | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-4.0-ultra-generate-exp-05-20 2 | ইমেজেন 4 আল্ট্রা এর পরীক্ষামূলক সংস্করণ | পূর্বরূপ | 2025-05-20 | নির্ধারণ করা |
ইমেজ 3 মডেলের নাম
মডেলের নাম | বর্ণনা | প্রকাশের পর্যায়ে | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-3.0-generate-002 | ইমেজেন 3 এর সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-01-23 | 2026-01-23 এর আগে কোনও আগে নেই |
imagen-3.0-generate-001 2 | ইমেজেন 3 এর প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে কোনও আগে নেই |
ইমেজ 3 দ্রুত মডেলের নাম
মডেলের নাম | বর্ণনা | প্রকাশের পর্যায়ে | মুক্তির তারিখ | অবসর তারিখ |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 | ইমেজেন 3 দ্রুতের প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে কোনও আগে নেই |
2 আপনি এপিআই কীভাবে অ্যাক্সেস করেন তা নির্বিশেষে জেমিনি বিকাশকারী এপিআই দ্বারা সমর্থিত নয়।
সমর্থিত ভাষা
মিথুন
সমস্ত জেমিনি মডেলগুলি নিম্নলিখিত ভাষায় বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
আরবি (এআর), বাংলা (বিএন), বুলগেরিয়ান (বিজি), চীনা সরল ও traditional তিহ্যবাহী (জেডএইচ), ক্রোয়েশিয়ান (এইচআর), চেক (সিএস), ডেনিশ (ডিএ), ডাচ (এনএল), ইংলিশ (এন), এস্তোনিয়ান (ইটি), ফিনিশ (এফআই), জার্মান (ডি), জার্মান (ডি) (হু), ইন্দোনেশিয়ান (আইডি), ইতালিয়ান (আইটি), জাপানি (জেএ), কোরিয়ান (কেও), লাত্ভিয়ান (এলভি), লিথুয়ানিয়ান (এলটি), নরওয়েজিয়ান (এনও), পোলিশ (পিএল), পর্তুগিজ (পিটি), রোমানিয়ান (আরও), রাশিয়ান (আরইউ), সার্বিয়ান (এসআর), স্লোভাক (এসকে), স্লোভেনিয়ান (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু), সোয়াহিলি (এসডাব্লু) (ইউকে), ভিয়েতনামী (vi)
জেমিনি ২.০ ফ্ল্যাশ , জেমিনি 1.5 প্রো এবং জেমিনি 1.5 ফ্ল্যাশ মডেলগুলি নিম্নলিখিত অতিরিক্ত ভাষাগুলিতে বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
আফ্রিকান (এএফ), আমহারিক (এএম), আসামিজ (এএস), আজারবাইজান (এজেড), বেলারুশিয়ান (বিই), বসনিয়ান (বিএস), কাতালান (সিএ), সেবুয়ানো (সিইবি), কর্সিকান (সিওয়াই), ডিভিও (ডিভি), ডিএইচআইএই (ডিভি), ডিএইচআইএইচআই (ডিভি), ডিএইচআইএইচআই (ডিএইচআই) ফিলিপিনো (তাগালগ) (ফিল), ফ্রিসিয়ান (এফওয়াই), আইরিশ (জিএ), স্কটস গ্যালিক ) ক্রিও (ক্রি), কুর্দিশ (কেইউ), কিরগিজ (কেওয়াই), লাতিন (এলএ), লাক্সেমবার্গিশ (এলবি), লাও (এলও), মালাগ্যাসি (এমজি), মাওরি (এমআই), ম্যাসেডোনিয়ান (এমকে), মালায়ালাম (এমএল), মঙ্গোলিয়ান (এমএন), মাইটেলন (মণিপুরি) (ম্যালি), ম্যালা (এমএনআই), মালাথি (এমআর) নেপালি (নে), নানজা (চিচওয়া) (এনওয়াই), ওডিয়া (ওরিয়া) (ওআর), পাঞ্জাবি (পিএ), পশতো (পিএস), সিন্ধি (এসডি), সিংহালা (সিংহালি) (সি), সামোয়ান (এসএম), শোনা (এসএন), সোমালি (এসও), আলবেনিয়ান (এসকিউ), সেসোথো (এসটি), সেসোথো (এসটি), সেসোথো (এসটি), সেসোথো (এসটি), সান্দান (এসটি), সান্দান (এসটি), সান্দান (এসটি), সেসদো (এসটি), সোন্দান (এসটি) (টিজি), ইউঘুর (ইউজি), উর্দু (ইউআর), উজবেক (ইউজেড), জোসা (এক্সএইচ), ইহুদী (ইয়ে), ইওরুবা (ইও), জুলু (জু)
ইমেজ
সাধারণ প্রাপ্যতা : ইংরেজি
পূর্বরূপ : চাইনিজ (সরলীকৃত), চাইনিজ (traditional তিহ্যবাহী), হিন্দি, জাপানি, কোরিয়ান, পর্তুগিজ, স্প্যানিশ
পুরানো মডেল সম্পর্কে তথ্য
ফায়ারবেস এআই লজিক পুরানো সক্রিয় জেমিনি মডেলগুলিকে সমর্থন করে ( জেমিনি 1.5 মডেলের মতো)।
ফায়ারবেস এআই লজিক পুরানো ইমেজডেন মডেলগুলিকে সমর্থন করে না (যেমন ইমেজেন 2 )।
মডেল | ইনপুট | আউটপুট | জন্য অনুকূলিত |
---|---|---|---|
মিথুন 1.5 প্রোgemini-1.5-pro-002 | পাঠ্য, কোড, পিডিএফএস, চিত্র, ভিডিও, অডিও | পাঠ্য, কোড, জসন | আরও বুদ্ধি প্রয়োজন জটিল যুক্তিযুক্ত কাজ সমর্থন করে; 2 মি দীর্ঘ প্রসঙ্গ |
মিথুন 1.5 ফ্ল্যাশgemini-1.5-flash-002 | পাঠ্য, কোড, পিডিএফএস, চিত্র, ভিডিও, অডিও | পাঠ্য, কোড, জসন | বিভিন্ন ধরণের কাজগুলিতে দ্রুত এবং বহুমুখী পারফরম্যান্স সরবরাহ করে |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
পরবর্তী পদক্ষেপ
জেমিনি এপিআই এর ক্ষমতা চেষ্টা করে দেখুন
- মাল্টি-টার্ন কথোপকথন (চ্যাট) তৈরি করুন।
- কেবল পাঠ্য-প্রম্পটগুলি থেকে পাঠ্য তৈরি করুন।
- চিত্র , পিডিএফএস , ভিডিও এবং অডিওর মতো বিভিন্ন ফাইলের ধরণের সাথে অনুরোধ করে পাঠ্য তৈরি করুন।
- উভয় পাঠ্য এবং মাল্টিমোডাল প্রম্পট থেকে কাঠামোগত আউটপুট (জেএসনের মতো) উত্পন্ন করুন।
- পাঠ্য প্রম্পটগুলি থেকে চিত্র তৈরি করুন ( মিথুন বা ইমেজেন )।
- Gemini Live API ব্যবহার করে স্ট্রিম ইনপুট এবং আউটপুট (অডিও সহ)।
- বাহ্যিক সিস্টেম এবং তথ্যের সাথে জেনারেটর মডেলগুলি সংযুক্ত করতে ফাংশন কলিং ব্যবহার করুন।