در این نوشته و برای درک بهتر قضیه بیز، می خواهیم نمونه های دیگری را نشان دهیم. در آغاز یک نمونه ساده و آن هم فضای پرتاپ دو سکه را بررسی می کنیم. در پرتاپ دو سکه و با فرض رو سکه H و پشت سکه T، فضای نمونه دارای چهار عضو {HH, HT, TH, TT} است. احتمال آمدن دو رو یا دو پشت، هر دو یکسان و برابر 1/4 هستند. احتمال آمدن دست کم یک پشت با احتمال دست کم یک رو یکسان بوده و برابر با 3/4 است.

اکنون می خواهیم احتمال دومین سکه رو (Head) باشد به شرط اینکه نخستین سکه پشت (Tail) باشد را بدست آوریم. فرض می کنیم (P(SCH احتمال اینکه دومین سکه رو باشد و (P(FCT احتمال اینکه نخستین سکه پشت باشد. بنابراین به دنبال (P(SCH|FCT هستیم که بر پایه قضیه بیر معادله زیر را خواهیم داشت.

SCH کوتاه شده Second Coin Head و FCT کوتاه شده First Coin Tail هستند.

با توجه به فضای نمونه، احتمال اینکه دمین سکه رو باشد برابر با 1/2=2/4 و احتمال اینکه نخستین سکه پشت باشد نیز برابر با 1/2=2/4 است. اکنون باید مقدار احتمال (P(FCT|SCH را بدست آوریم که برابر است با احتمال اینکه نخستین سکه پشت باشد به شرط اینکه دومین سکه رو باشد که برابر با 1/2 است و اکنون با جایگذاری مقدارهای بدست آمده در معادله بیز بالا، احتمال اینکه دومین سکه رو باشد به شرط اینکه نخستین سکه پشت باشد، برابر با 1/2 می شود.

فرض کنید می خواهیم احتمال خرید کردن (Yes) یا خرید نکردن (No) یک مشتری را بر پایه داده های خرید گذشته بدست آوریم. در شکل زیر یک مجموعه داده داریم که دارای سه ویژگی به نام روز (Day)، تخفیف (Discount) و فرستادن رایگان بسته خرید (Free Delivery) است. هر یک از این ویژگی ها مستقل از دیگری هستند و هر کدام دارای مقدارهایی هستند. برای نمونه ویژگی روز خرید می تواند Weekday (یک روز عادی از هفته)، Holiday (روز تعطیل) و Weekend (پایان هفته) است. مسئله از گونه طبقه بندی دودویی (Binary Classification) است زیرا تنها دو کلاس Yes (خرید) و No (خرید نکردن) را داریم.

شکل زیر تنها ۱۵ نمونه را نشان می دهد ولی خواهید دید که در ادامه برای حل مسئله یک مجموعه داده یا فضای نمونه ۳۰ تایی را در نظر می گیریم.

جدول تکرار یا Frequency Table

جدول تکرار به ما می گوید از هر چیزی یا بهتر است بگوپییم از هر مشاهده (Observation) چند بار در میان نمونه ها هست. برای نمونه در فهرست مشاهده های پیش رو 1, 2, 3, 4, 6, 9, 9, 8, 5, 1, 1, 9, 9, 0, 6, 9، شماره ۹، پنج بار تکرار شده است. شکل زیر هر یک از جدول های هر سه ویژگی مجموعه داده بالا را نشان می دهد. بنابراین برای هر یک از ویژگی ها یک جدول تکرار را رسم می کنیم که در آن تکرار هر یک از مقدارهای آن ویژگی برای هر یک از کلاس ها را نشان می دهیم.

بنابراین از جدول بالا می توانیم بدانیم از میان خریداران، ۱۹ نفر اگر تخفیف داده می شده است (Discount=Yes) حرید کرده اند (Buy=Yes) و همچنین ۱ نفر با اینکه نخفیف داده شده است ولی خرید نکرده است (Buy=No). از میان خریداران ۵ نفر با اینکه تخفیف داده نشده است (Discount=No) ولی خرید کرده اند و ۵ نفر چون تخفیف داده نشده است، پس خرید هم نکرده اند.

توجه کنید جدول تکرار بالا و جدول Likelihood که در ادامه می گوییم، بر پایه ۳۰ نمونه (ونه ۱۵ نمونه شکل نخست) فراهم شده اند.

توجه کنید که، هر یک از سه ویژگی بالا، در حل مسئله بیز ساده، مستقل از یکدیگر هستند. با توجه به این مجموعه داده، ما به دنبال پیش بینی خرید کردن به شرط رخ دادن یکی از سه ویژگی هستیم، بنابراین اگر (P(A برابر با احتمال خرید کردن A=Buy=Yes باشد و (P(B احتمال یکی از سه ویزگی B=Day یا B=Discount یا B=Free Delivery باشد، پس ما به دنبال (P(A|B هستیم.

جدول Likelihood

جدول دیگری که باید پیاده سازی کنیم، Likelihood است که احتمال خرید کردن یا خرید نکردن به ازای هر یک از مقدارهای هر کدام از ویژگی ها را نشان می دهد. در شکل زیر جدول تکرار دوباره نشان داده شده است و می توانید برای ویزگی Day و به ازای همه سه مقدار آن، از ۳۰ نمونه ۲۴ نمونه خرید شده و ۶ نمونه خرید نشده است.

در شکل بالا برای نمونه احتمال اینکه روز عادی باشد به شرط اینکه خرید کرده باشد (P(B=Day=Weekday| A=Buy=Yes برابر با 9/24 است و  احتمال اینکه روز عادی از هفته باشد به شرط خرید نکردن (P(B=Day=Weekday| A=Buy=No برابر با 2/6 است. همچنین احتمال روز عادی برابر 11/30 است زیرا از میان ۳۰ نمونه ۱۱ نمونه مقدار ویژگی Day آنها برابر با Weekday است.

مسئله این است که احتمال خرید نکردن به شرط اینکه یک روز عادی هفته باشد، یعنی (P(Buy=No | Day=Weekday را بدست آوریم. با توجه به این مسئله، معادله بیز به صورت زیر خواهد بود. که در آن احتمال روز عادی بودن به شرط خرید نکردن برابر با 2/6 و احتمال خرید نکردن برابر با 6/30 و احتمال روز عادی بودن برابر با 11/30 است و از این رو با جایگذاری این مقدارها، احتمال خرید نکردن به شرط روزی عادی بودن برابر با 0.179 خواهد بود.

 

مسئله دیگر بر پایه مقدار هر سه ویژگی است، برای نمونه می خواهیم احتمال خرید نکردن به شرط اینکه یک تعطیلی رسمی (Day=Holiday) و تخفیف دادن (Discount=Yes) و تحویل رایگان (Free Delivery=Yes) را بدست آوریم. شکل زیر معادله بیز برای این مسئله و مقدارهای جایگذاری شده را نشان می دهد. توجه کنید که در اینجا A|B برابر با احتمال A=Buy=No به شرط ویژگی ها با مقدارهای گفته شده است.

مسئله دیگر بر پایه مقدار هر سه ویژگی است، برای نمونه می خواهیم احتمال خرید کردن به شرط اینکه یک تعطیلی رسمی (Day=Holiday) و تخفیف دادن (Discount=Yes) و تحویل رایگان (Free Delivery=Yes) را بدست آوریم. شکل زیر معادله بیز برای این مسئله و مقدارهای جایگذاری شده را نشان می دهد. توجه کنید که در اینجا A|B برابر با احتمال A=Buy=Yes به شرط ویژگی ها با مقدارهای گفته شده است.

نرمال سازی احتمال ها برای بدست آوردن نرخ Likelihood

بنابراین احتمال خرید کردن برابر با 0.986 و احتمال خرید نکردن برابر با 0.178 است. اکنون برای پیدا کردن نرخ Likelihood، نخست مقدار دو احتمال را با هم جمع کرده که برآیند (نتیجه) آن برابر است با 1.164 = 0.178 + 0.986 و سپس هر یک از دو مقدار احتمال را بر شماره 1.164 بخش (تقسیم) می کنیم که %84.71 = 0.986/1.164 و %15.29 = 0.178/1.164 و آشکار است که شماره %84.71 از %15.29 بیشتر است. بنابراین می توانیم نتیجه بگیریم که یک میانگین از خریداران در روز تعطیل رسمی (Holiday) و دارای تخفیف و فرستادن رایگان، از فروشگاه خرید کرده اند.