এ / বি টেস্টিং: আপনার পরীক্ষা শুরুর আগে কীভাবে নমুনার আকার গণনা করবেন

ধরুন আপনি এখনই এক সপ্তাহ ধরে একটি / বি পরীক্ষা চালাচ্ছেন, এবং আপনার ব্যবসায়িক স্টেকহোল্ডারদের দ্বারা আপনাকে প্রতিদিন জিজ্ঞাসা করা হচ্ছে, "আমরা পরীক্ষাটি কতক্ষণ চালানোর পরিকল্পনা করছি? আমাদের কি এখনও তাত্পর্য আছে? "। এটি কোনও অস্বাভাবিক পরিস্থিতি নয়। প্রকৃতপক্ষে সমস্ত পণ্য পরিচালক এই সমস্যাটিতে চলে into অনেক সময় বাদে আমাদের কোন ধারণা নেই যে আমাদের কতক্ষণ পরীক্ষা চালানো উচিত, তাই আমরা ফলাফলগুলিকে এমন এক প্রত্যাশায় দেখি যে আমাদের তাত্পর্য পৌঁছে যায়। আপনি যদি পরীক্ষা চালাচ্ছেন তবে সমস্যাটির যৌগগুলি আপনি কোনও উত্থানের প্রত্যাশা করেন না - এটি হয় নান্দনিক কারণে বা উপার্জনের উল্টো কারণে হতে পারে। কতক্ষণ চালানো উচিত? কৌতুক তাই না?

আমরা কত নমুনা সংগ্রহ করতে যাচ্ছি তা না জেনে আদর্শভাবে আমাদের কখনও পরীক্ষা শুরু করা উচিত নয়। কেন? অন্যথায়, আপনি ডেটা সন্ধান করবেন এবং আপনি 'ডেটা পিকিং' শেষ করবেন, যা তাত্পর্য অর্জনের সাথে সাথে পরীক্ষা বন্ধ করে দিচ্ছে। এখানে একটি উদাহরণ দেওয়া আছে - মনে করুন আপনার একটি মুদ্রা রয়েছে এবং আপনার অনুমানটি এটি ন্যায্য। কীভাবে প্রমাণ করবেন? সহজ - এটি 100 বার টস করুন। তবে আপনি যদি এটি 10 ​​বার টস করেন এবং লেজগুলি 10 বার দেখেছিলেন তবে কী হবে। সময় মতো এই পরীক্ষাটি থামানো এবং নাল অনুমানকে প্রত্যাখ্যান করা পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ বলে মনে হচ্ছে - মুদ্রাটি ন্যায্য। কি ভুল ছিল? আপনি পরীক্ষা খুব শীঘ্রই বন্ধ করে দিয়েছেন। আপনার কতক্ষণ পরীক্ষা চালানো উচিত তা নিয়ে আপনার কোনও ধারণা নেই। আপনি যদি নমুনা আকারটি গণনা না করেন তবে আপনি যে অন্য সমস্যার মধ্যে পড়তে পারেন তা হ'ল আপনি কতক্ষণ পরীক্ষা চালাচ্ছেন তা আত্মবিশ্বাসের সাথে বলতে সক্ষম হবেন না।

সুতরাং আমরা কিভাবে এই কাছে যান?

পণ্য পরিচালনার প্রথম নিয়ম অনুসরণ করুন - অস্পষ্টতাকে জড়িয়ে ধরুন তবে অনিশ্চয়তা এড়ান।

এইভাবে আমরা নমুনার আকার গণনা করতে যেতে পারি: ধরুন আমরা একটি A / B পরীক্ষা চালাচ্ছি যেখানে: ইমেলের জন্য সাইন আপ করার মতো একটি ইভেন্টের জন্য আমাদের বর্তমান রূপান্তর হার 10% এবং আমরা 10% উন্নয়নের আশা করি চিকিত্সা জিতলে রূপান্তর। তারপর,

বেসলাইন রূপান্তর: P1 = 20%

রূপান্তরটিতে উত্সাহ: 10% (এটি আপনার পরিবর্তনের প্রত্যাশিত প্রভাব হিসাবে অনুমান করা হয়েছে)। বৃদ্ধি দলের অংশ হিসাবে, আমরা সাধারণত 20% উন্নয়নের লক্ষ্য রাখি তবে আপনার পণ্যটি কতটা পরিপক্ক হয়েছে তার উপর নির্ভর করে 10% এমনকি বড় হতে পারে। আপনি যত তাড়াতাড়ি তাত্পর্যতে পৌঁছবেন তত উন্নতি হবে।

চিকিত্সা গোষ্ঠীর প্রত্যাশিত রূপান্তর: পি 2 = 20% * (1 + 10%) = 22%

তাৎপর্য স্তর: এটি একটি মিথ্যা ধনাত্মক হওয়ার সম্ভাবনা অর্থাৎ 5% তাত্পর্যপূর্ণ স্তরে এটি কী সম্ভাবনা যা আমরা যখন নাল অনুমানটি বাতিল করব যখন এটি বাস্তবে ছিল (যা আপনি কখনই জানেন না) সত্য ছিল। অবশ্যই, আমরা এই ত্রুটিটি হ্রাস করতে চাই তাই আমরা 5% বেছে নিই। আপনার যদি ট্রাফিক কম থাকে তবে আপনি এটি 10% বা 20% পর্যন্ত বাড়িয়ে দিতে চাইতে পারেন।

মিথ্যা ধনাত্মক: টাইপ আই ত্রুটি - নাল অনুমানটি সত্য হলে প্রত্যাখ্যান করা

পরিসংখ্যানগত শক্তি: এটি সম্ভবত আপনি একটি মিথ্যা নেতিবাচক পাবেন সম্ভাবনা। রাম রাম! পাওয়ার (= 1 - দ্বিতীয় ধরণের ত্রুটি) টাইপ II ত্রুটি এড়িয়ে যাওয়ার সম্ভাবনা বা অন্য কথায় পাওয়ার হ'ল সম্ভাবনা হ'ল পরীক্ষাটি নাল হাইপোথিসিস থেকে কোনও বিচ্যুতি সনাক্ত করতে পারে, যদি এই জাতীয় বিচ্যুতি উপস্থিত থাকে। সাধারণত আমরা এটি 80% এ সেট করি।

মিথ্যা নেতিবাচক: দ্বিতীয় ধরণের ত্রুটি - নকল অনুমানটি মিথ্যা হলে প্রত্যাখ্যান করতে ব্যর্থ

এখন আমাদের কাছে এমন সমস্ত কিছু রয়েছে যা আমরা আসলে এগিয়ে যেতে পারি এবং প্রয়োজনীয় নমুনার আকার গণনা করতে পারি। আমরা হয় কোনও অনলাইন ক্যালকুলেটর, জি পাওয়ার সরঞ্জাম বা আর ব্যবহার করতে পারি আপনি কোন সরঞ্জামটি ব্যবহার করছেন তার উপর নির্ভর করে আপনি কিছুটা ভিন্ন সংখ্যা দেখতে পারেন তবে তা ঠিক।

আসুন আমরা তাদের প্রত্যেকে একে একে দেখতে পাচ্ছি:

ক) এখানে যেমন অনলাইন ক্যালকুলেটর

খ) জি * পাওয়ার সরঞ্জামটি ব্যবহার করুন: এখান থেকে সরঞ্জামটি ডাউনলোড করুন। 'অনুপাত: দুটি স্বতন্ত্র অনুপাতের মধ্যে পার্থক্য' হিসাবে টেস্ট পরিবার 'জেড টেস্টস', পরিসংখ্যান পরীক্ষায় যান এবং P1, P2, আলফা (পরিসংখ্যানগত তাত্পর্য), পাওয়ার = 0.8 যোগ করুন।

প্রত্যাশিত আউটপুট:

গ) আর: যে ফাংশনটি আমরা ব্যবহার করতে যাচ্ছি তা হ'ল পাওয়ার.প্রপ.স্টেস্ট (ম্যান পেজ)।

পাওয়ার.প্রপ.এস্ট (এন = নুল, পি 1 = নুল, পি 2 = নুল, সিগ.লেভেল = 0.05, পাওয়ার = নুল, বিকল্প = সি ("two.sided", "one.sided"), কঠোর = মিথ্যা)

এখানে যে কোনও অনলাইন আর সংকলক যান এবং নীচের সাথে কমান্ড লিখুন NULL তে সেট করুন।

পাওয়ার.প্রপ.টেস্ট (এন = এনএলএল, পি 1 = 0.2, পি 2 = 0.22, পাওয়ার = 0.8, বিকল্প = 'two.sided', sig.level = 0.05)

এটি আউটপুট যা আপনি আর এ পাবেন

অনুপাত শক্তি গণনার দ্বি-নমুনা তুলনা 
             n = 6509.467 পি 1 = 0.2 পি 2 = 0.22 সিগ.লেভেল = 0.05 পাওয়ার = 0.8 বিকল্প = দ্বিগুণ
দ্রষ্টব্য: n প্রতিটি * গ্রুপে নম্বর

এর অর্থ হ'ল আমাদের প্রতিটি গ্রুপে প্রায় 6510 টি নমুনা লাগবে। যার অর্থ আমাদের 13020 ট্র্যাফিকের প্রয়োজন হবে।

এখন ধরা যাক আপনি historতিহাসিকভাবে জানেন যে আপনার ওয়েবসাইটের ট্র্যাফিকটি 2000 দর্শকের হয়ে থাকে তবে আপনি জানেন যে আপনাকে 6.51 দিন বা 7 দিনের জন্য আপনার অনুমান পরীক্ষা চালাতে হবে।

বোনাস পয়েন্ট: বেশিরভাগ ব্যবসায়ের চাহিদা ধাঁচে 'সাপ্তাহিকতা' থাকায় সপ্তাহের সমস্ত দিন coverেকে রাখা সবসময় ভাল ধারণা।

এখন পরের বার আপনি এ / বি পরীক্ষা চালাচ্ছেন, প্রয়োজনীয় নমুনা আকারটি প্রাক-গণনা করুন যাতে আপনি আপনার ব্যবসায়ের অংশীদারদের সাথে সঠিক প্রত্যাশা সেট করতে পারেন।

সেক্ষেত্রে আপনি নমুনার আকারটি আরও বড় আকারের দেখতে পেয়েছেন যে আপনি ভাবেন না যে আপনার ওয়েবসাইটের ট্র্যাফিকের কারণে আপনি তাত্পর্য অর্জন করতে পারবেন, চিন্তা করবেন না, অন্য পোস্টে আমি কীভাবে এ / বি চালাতে হবে তার কয়েকটি কৌশল অবলম্বন করব যখন আপনার পর্যাপ্ত ট্র্যাফিক নেই তখন পরীক্ষা করুন। ততক্ষণে, খুশি এ / বি পরীক্ষা।

আরো দেখুন

প্রোগ্রামিংয়ে আমরা একটি কম্পিউটারকে কিছু করার জন্য আদেশ করি তবে কীভাবে বোঝা যায় যে এই শব্দগুলি বা আদেশগুলি আসলে কী বোঝায় (উদাহরণস্বরূপ মুদ্রণ)? আপনি কীভাবে তৈরি করতে জানেন সেরা সিএসএস নেভিগেশন মেনু কী? আপনি কীভাবে এটি তৈরি করবেন আমাকে বলার আপত্তি করবেন?আমি কীভাবে ওয়েবসাইট তৈরি করব এবং এটি থেকে উপার্জন করব? এইচটিএমএল, সিএসএস এবং জেএস শিখতে কতক্ষণ সময় নিতে পারে? অ্যাপ্লিকেশন বিকাশকারী হিসাবে, যখন আমার কাছে বিভিন্ন অ্যাপ থাকে তবে আমি কীভাবে বাজারজাত করব? আমি কীভাবে পিএইচপি এবং ওয়েব ডিজাইন শিখতে পারি? ইনস্টাগ্রাম অনুসারীদের কীভাবে আড়াল করবেনকীভাবে গুগল বিজ্ঞাপন পরিষেবা বন্ধ করবেন stop