پایتون زبان برنامه نویسی است که بسیار رشد کرده است و در بیشتر زمینه ها مانند طراحی وب، وب اسکرپینگ و استخراج داده ها، کار با پایگاه داده های رابطه ای و غیر رابطه ای NoSQL، نوشتن برنامه های چند پردازشی، کنترل همروندی، موازی و توزیع شده، برنامه های رویداد گرا (Event Driven)، برنامه نویسی فرستادن پیام (Message Passing)، نوشتن و ایجاد بازی ها و بسیاری دیگر از زمینه های کاربرد دارد.

در واقع توسعه دهندگان متفاوت برای هر یک از این کاربردها، کتابخانه های گوناگونی را نوشته اند که بیشتر آنها به صورت متن باز هستند. به عبارت دیگر خود پایتون به صورت درونی این کتابخانه ها را ندارد و گروه های متفاوت برای پوشش دادن یک نیازها، کتابخانه های گوناگون را نوشته اند.

برای شروع یادگیری ماشین با پایتون، پیش از هر چیز باید تا اندازه مناسبی با زبان برنامه نویسی پایتون آشنایی داشته باشد. پس با آشنایی با زبان پایتون، می توانید فهرست نوشته های این دوره را بخوانید و پس از اتمام آنها به سراغ دوره یادگیری ماشین با پایتون بروید.

بنابراین در این دوره نوشته هایی را آماده کرده ایم که شما را با کتابخانه هایی مانند Pandas، NumPy، SciPy، Matplotlib و Scikit-Learn آشنا می کند. البته در فهرست نوشته های یادگیری ماشین با پایتون به طور کامل کتابخانه Scikit-Learn آموزش داده شده است اما برخی از کلاس ها و جنبه های این کتابخانه، در همین دوره بررسی شده اند.

در این مجموعه از نوشته می خواهیم ماژول ها و کتابخانه هایی از پایتون را معرفی کنیم که در زمینه های یادگیری ماشین (Machine Learning)، داده کاوی (Data Mining) و به طور کلی دانش داده ها (Data Science) کاربرد واهمیت دارند. این مجموعه نوشته ها پیش نیاز ورود به بحث تجزیه و تحلیل داده ها (Data Analysis) نیز هستند.

در این نوشته به شما یاد می دهیم که چگونه توسط ماژول NumPy آرایه های تک بعدی، دو بعدی (ماتریس ها) و چند بعدی را ایجاد کنید. مفهوم و کاربرد ساختار داده DataFrame و عملیات های گوناگون روی آن و چگونگی خواندن فایل های اکسل، CSV، XML و JSON و ذخیره آنها در ساختار داده DataFrame یا Series توسط ماژول Pandas را آموزش داده ایم.

همچنین سعی شده توسط مازول SciPy جنبه های ریاضی مرتبط با یادگیری ماشین داده کاوی و به طور کلی دانش داده ها را نیز پوشش دهیم تا شما بتوانید درک بهتری از کتاب ها و مقاله های این زمنیه ها داشته باشید. میانگین، میانه، مُد، واریانس، انحراف معیار و دیگر مفاهیم زمینه هایی از ریاضی هستند که باید با آنها آشنایی داشته باشید.