এমপ্লো মোজাপেলো আনস্প্ল্যাশ-এর ​​ছবি

এআই এপিআই: সেগুলি কী এবং কীভাবে সেগুলি ব্যবহার করবেন

কৃত্রিম বুদ্ধিমত্তা API এর জন্য আরও ভাল অনুশীলনের একটি সেট

আপনি কি স্পিচ-টু-টেক্সট, ভাষার অনুবাদ, বা চিত্র সনাক্তকরণ APIs সম্পর্কে আগ্রহী? তোমার ভাগ্য ভাল! প্রচুর পরিষেবা রয়েছে যা আপনাকে এটি করতে দেয় এবং আপনার অ্যাপ্লিকেশনগুলিতে কৃত্রিম বুদ্ধিমত্তা (এআই) এপিআই ব্যবহার করার প্রচুর কারণ রয়েছে। এই নিবন্ধে, আমরা এআই এপিআইয়ের কয়েকটি ব্যবহারের ক্ষেত্রে বর্ণনা করব এবং সেগুলি ব্যবহার করার সময় গ্রহণ করার জন্য আরও ভাল পদ্ধতি সম্পর্কে কথা বলব।

আপনি যদি তাড়াহুড়ো করে থাকেন তবে নীচে TL; DR এ যান to

আপনার নিজেকে জিজ্ঞাসা করা বাহ্যিক পরিষেবা প্রয়োগের আগে প্রথম প্রশ্নটি হ'ল "আমার কি এটি দরকার"? যখন এটি কৃত্রিম বুদ্ধিমত্তা-ভিত্তিক এপিআইগুলিতে আসে উত্তরটি জটিল হয়ে উঠতে পারে! আপনাকে সিদ্ধান্ত নিতে সহায়তা করতে, আসুন সর্বাধিক ব্যবহৃত ব্যবহৃত দুটি পরিষেবাদি এবং আপনার কখন সেগুলি ব্যবহার করা উচিত (বা করা উচিত নয়) দেখুন।

কেস # 1 ব্যবহার করুন: স্পিচ-টু-টেক্সট

আজ অনেক অ্যাপ্লিকেশন স্পিচ-টু-টেক্সট সক্ষমতা অর্জন করছে - এবং আপনি সম্ভবত ইতিমধ্যে এটি ব্যবহার করেছেন। সিরি, গুগল অ্যাসিস্ট্যান্ট, বিক্সবি বা আলেক্সা সকলেই এটিকে ব্যবহার করছে, তবে এটি কিছুই নয়। এটি মেসেজিং অ্যাপস (যেমন হোয়াটসঅ্যাপ) এবং সার্চ ইঞ্জিনগুলি (যেমন গুগলের সার্চ-বার) দ্বারাও ব্যবহৃত হয়।

আপনি ভাবতে পারেন সেখানে এআই কোথায় আছে? এটি কি কেবল বক্তৃতার প্রতিলিপি নয়?

যে কোনও স্পিচ-টু-টেক্সট এপিআইয়ের ভিত্তি হ'ল স্পিচ অডিওটিকে একটি ইনপুট হিসাবে গ্রহণ এবং এটি পাঠ্যে প্রতিলিপি করা হয়, যদিও এটি এখানে থামবে না, এবং এটি তখনই যখন কৃত্রিম বুদ্ধিমত্তার যাদু ঘটে। সেখানে উপলব্ধ বেশিরভাগ এপিআইয়ের জন্য, এটিও করবে:

  • প্রসঙ্গের ভিত্তিতে পূর্ববর্তী প্রতিলিপি পরিবর্তন করুন
  • বিভিন্ন স্পিকার শনাক্ত করুন
  • নির্দিষ্ট কীওয়ার্ড সন্ধান করতে সক্ষম হন
  • মডেল ব্যক্তিগতকরণের জন্য অনুমতি দিন (আঞ্চলিক উচ্চারণের জন্য দরকারী)

এটি ব্যবহার করুন: নির্দিষ্ট ব্যবহারের ক্ষেত্রে যেমন যেমন একটি পরীক্ষার সময় বক্তৃতা সংশ্লেষণের সময় যেখানে প্রসঙ্গ, শব্দ ব্যবহৃত হয় এবং বর্তমান স্পিকারটি অনেক গুরুত্বপূর্ণ।

এটি ব্যবহার করবেন না: আপনি যদি কেবলমাত্র একক স্পিকার বা সাধারণ পাঠ্য বার্তাপ্রেরণের জন্য প্রত্যাশা করছেন। সেক্ষেত্রে বেশিরভাগ স্মার্টফোন কীবোর্ডগুলিতে ইতিমধ্যে ব্যবহার করা যেতে পারে এমন একটি স্পিচ স্বীকৃতি ক্ষমতা এবং ওয়েব অ্যাপ্লিকেশনের জন্য আপনি স্পিচসিন্থেসিস এপিআই ব্যবহার করতে পারেন।

কেস # 2 ব্যবহার করুন: চিত্রের স্বীকৃতি

স্পিচ-টু-টেক্সটের সাথে তুলনা করে, আজকাল কেবলমাত্র কয়েকটি অ্যাপ্লিকেশন রয়েছে যা ইমেজ রিকগনিশন ব্যবহার করছে এবং তাদের বেশিরভাগই বেশ সুনির্দিষ্ট (উদাহরণস্বরূপ প্ল্যান্টনেট যা আপনি যে ছবিটি নিচ্ছেন সেই গাছগুলি সনাক্ত করে)। যদিও আমরা এর কিছু সাধারণ ব্যবহার দেখতে শুরু করছি, বিশেষত:

  • গুগল লেন্স: আপনার স্ক্রিনে কী রয়েছে তা বিশ্লেষণ করে (ছবিটি না কী) এবং ঠিকানাগুলি, স্থানগুলি, জিনিসগুলি সনাক্ত করার চেষ্টা করবে এবং এর ভিত্তিতে ফলাফলের প্রস্তাব দেবে
  • এআই দেখছেন: দৃষ্টি প্রতিবন্ধীদের জন্য অ্যাপ্লিকেশন যা তাদের চারপাশে কী রয়েছে তা বর্ণনা করে (যেখানে ফোনের ক্যামেরাটি নির্দেশ করছে তার উপর ভিত্তি করে)
কোনও জায়গা চিনতে গুগল লেন্স ব্যবহার করা

আপনি এখনই বুঝতে পেরেছেন, এখানে যাদুটি হ'ল কোনও চিত্রকে একটি ইনপুট হিসাবে নেওয়া এবং উল্লিখিত ছবিতে কী আছে তা সনাক্ত করার চেষ্টা করা। বেশিরভাগ সরবরাহকারীদের পক্ষে এটি করার দুটি উপায় রয়েছে:

  • প্রাক-প্রশিক্ষিত মডেলগুলি ব্যবহার করে: এর মধ্যে সাধারণ ক্লাস (খাবার, স্থান, লোক, রঙ…) অন্তর্ভুক্ত রয়েছে
  • কাস্টম শ্রেণিবদ্ধকারী ব্যবহার করে: এটি ব্যবহারকারীদের তাদের নিজস্ব ক্লাসগুলি প্রশিক্ষণের জন্য অনুমতি দেয় (উপরে প্ল্যানটনেটের সাথে দেখা হিসাবে)

যদিও কিছু অ্যান্ড্রয়েড এবং আইওএস ডিভাইসগুলির বিকাশকারী হিসাবে ইমেজ স্বীকৃতি ক্ষমতা অন্তর্নির্মিত রয়েছে, আপনি সর্বদা সেগুলি আপনার অ্যাপ থেকে জিজ্ঞাসা করতে পারবেন না। সুতরাং যতক্ষণ আপনার ব্যবহারের ক্ষেত্রে ফিট থাকে ততক্ষণ আপনার এটি ব্যবহার করা উচিত।

কেস # 3, # 4 ব্যবহার করুন ...

সেখানে প্রচুর অন্যান্য এআই এপিআই রয়েছে। আমরা এই পোস্টে তাদের সকলের মধ্য দিয়ে যাব না, তবে আপনি যদি সেগুলির মধ্যে একটি ব্যবহার করার কথা ভাবছেন এবং আপনার ব্যবহারের ক্ষেত্রে প্রয়োজনীয়তাটি উপযুক্ত কিনা তা নিশ্চিত না হন, তবে একটি মন্তব্য করুন বা সরাসরি আমার সাথে যোগাযোগ করুন। আমি সাহায্য করতে খুশি!

আপনি এখন সিদ্ধান্ত নিয়েছেন একটি, দুটি, বা আরও বেশি ব্যবহার করুন (সেক্ষেত্রে, আপনার জন্য একটি নিবন্ধ এখানে) আপনার অ্যাপ্লিকেশনটিতে এআই APIs। এই বিভাগে আমরা সেগুলিকে উত্পাদনে ব্যবহারের চিন্তা করার আগে গ্রহণ করার জন্য আরও কয়েকটি ভাল অনুশীলন দেখতে পাব।

আপনি কেনার আগে চেষ্টা করুন

প্রতি তৃতীয় পক্ষের এপিআই-এর মতোই, আমলে নেওয়ার মতো প্যারামিটার রয়েছে - দাম, ব্যবহারযোগ্যতা, প্রাপ্যতা ... তবে যখন কৃত্রিম বুদ্ধিমত্তার বিষয়টি আসে তখন একটি নির্ভরযোগ্যতা ফ্যাক্টরও আসে যা খেলায় আসে el নির্ভরযোগ্যতা বাইনারি বিবেচনা নয়, এবং জিতেছে ' t 0 বা 1 রেট করুন বাস্তবে এটি 0 এবং 1 এর মধ্যে যে কোনও কিছু হবে যেমন আমরা পরের অংশে দেখব!

সমস্ত বড় মেঘ সরবরাহকারী তাদের নিজস্ব এআই এপিআইয়ের সেট সরবরাহ করে এবং তাদের সবারই হয় একটি বিক্ষোভ পৃষ্ঠা বা একটি বিনামূল্যে ট্রায়াল। এর সদ্ব্যবহার করুন, নিজের জন্য চেষ্টা করুন এবং সেরা ফলাফল পান এমনটি চয়ন করুন!

  • আইবিএম ওয়াটসন
  • গুগল ক্লাউড এআই
  • মাইক্রোসফ্ট কগনিটিভ সার্ভিসেস
  • এডাব্লুএস এআই পরিষেবাগুলি

এখানে ক্লিরিফাই (ভিশন এপিআই), এসএপি কথোপকথন এআই (চ্যাটবটস), বা আপনার পছন্দের-সন্ধান-ইঞ্জিন-এখানে সন্ধানের মতো নির্দিষ্ট পরিষেবার জন্য প্ল্যাটফর্মও রয়েছে are

পোস্টম্যান ব্যবহার করে ওয়াটসন সহকারী পরিষেবা কল করার উদাহরণ

আত্মবিশ্বাসের সাথে কৃত্রিম বুদ্ধি ছড়াচ্ছে

পূর্ববর্তী বিভাগে যেমন বলা হয়েছে, প্রতিবার আপনি যখন এআই এপিআইয়ের কাছ থেকে প্রতিক্রিয়া পাবেন, তখন এটিতে 0 থেকে 1 এর মধ্যে একটি আত্মবিশ্বাসের স্তরও থাকবে যা এটি কোনও কিছুকে স্বীকৃতি দিয়েছে এমন শতাংশের সাথে সামঞ্জস্য করে।

নীচের চিত্রটি প্রেরণ করার সময় ভিজ্যুয়াল রিকগনিশন এপিআই সহ একটি উদাহরণ নেওয়া যাক:

ক্রেডিট: গেট্টি.কম

এখানে জেএসওএন প্রতিক্রিয়া। পাঠযোগ্যতার জন্য আমি কিছু ক্লাস সরিয়ে ফেলেছি।

[{"শ্রেণিবদ্ধ_আইডি": "ডিফল্ট", "নাম": "ডিফল্ট", "শ্রেণি": [{"শ্রেণি": "বাস", "স্কোর": 0.797}, {"শ্রেণী": "যান্ত্রিক ডিভাইস", " স্কোর ": 0.506}, {" শ্রেণী ":" ভারতীয় লাল রঙ "," স্কোর ": 0.799}]," প্রদর্শন ":" সাধারণ মডেল "," বিবরণ ":" এর মধ্যে অবজেক্টস, ক্রিয়াকলাপ, দৃশ্য এবং রঙগুলি দ্রুত বুঝতে হবে একটি চিত্র." }]

এই ক্ষেত্রে, আমাদের একটি ক্লাস রয়েছে যা আত্মবিশ্বাসের স্কোর সহ সনাক্ত করা যায়। এই স্কোরটিকে অ্যাকাউন্টে নেওয়া কী। আমি সাধারণত 95% ন্যূনতম আত্মবিশ্বাসের স্কোরের প্রস্তাব দিই। আপনি বা আপনার এপিআই সরবরাহকারীরা মডেলগুলিতে আরও প্রশিক্ষণ ডেটা যুক্ত করার সাথে সাথে এই স্কোরটি সময়ের সাথে সাথে বাড়তে হবে।

প্রশিক্ষণ ডেটার কথা বলার জন্য, আপনি যে আরেকটি বিষয় বিবেচনা করতে চাইবেন তা হ'ল আপনি কি আপনার অ্যাপ্লিকেশন থেকে প্রেরিত ডেটা আপনার সরবরাহকারীর সাধারণ মডেলগুলিকে উন্নত করতে ব্যবহার করার অনুমতি দিতে চান কিনা। আপনি যদি এটির অনুমতি দিতে চান তবে আপনার ব্যবহারকারীদের স্পষ্টভাবে জানাতে হবে।

টি এল; ডিআর:

  • একটি এআই এপিআই ব্যবহার করার আগে, আপনার যদি সত্যিই এটির প্রয়োজন হয় তা ঠিক করুন
  • যদি আপনি তা করেন, তবে বিভিন্ন সরবরাহকারী চেষ্টা করুন এবং আপনার ব্যবহারের ক্ষেত্রে সবচেয়ে ভাল ফিট করে এমন একটি নির্বাচন করুন
  • মিথ্যা ধনাত্মকতা এড়াতে আত্মবিশ্বাসের স্কোরের পর্যায়ে যথেষ্ট পর্যাপ্ত একটি উচ্চ স্তরের থাকা নিশ্চিত করুন

আপনার অ্যাপগুলিতে এআইকে ইনফিউজড করতে মজা করুন!