استاد عزیز ممنونم از توضیحات آموزنده تون و تدریس فوق العاده تون
آموزش وب اسکرپینگ با پایتون
برای رشد بیشتر و حرفه ای تر شدن در هر حوزه ای، ما نیازمند خارج شدن از منطقه امن خود هستیم. شاید شما بعد از یادگیری زبان پایتون، مراحل بسیار زیادی را برای حرفه ای تر شدن خود از قبل برنامه ریزی کرده باشید، اما میتوان یکی از بهترین مراحل برای رشد و پیشرفت در حوزه پایتون را (وب اسکرپینگ) دانست. وب اسکرپینگ، یکی از بهینه ترین و جذاب ترین روش های استخراج داده های گوناگون در سال 2023 بشمار می رود. این مهارت، به زبان ساده به فرآیند جمع آوری داده های گوناگون با ساختار های متفاوت در دنیای وب سایت ها می گویند.
شاید برای شما هم پیش آمده باشد که اطلاعات یک وب سایت را از روی علاقه مندی تان برای خودتان کپی کرده باشید تا بتوانید در زمان دیگر از آن داده ها استفاده کنید. اما نکته مهم این است که شما داده ها را بصورت دستی استخراج کردید و از ابزار هایی مثل وب اسکرپینگ بهره ای نبرده اید. در این دوره آموزشی فرا میگیریم که چگونه این داده ها را بصورت اتوماتیک و بهینه استخراج کنیم. در ادامه به معرفی دوره آموزش وب اسکرپینگ در پایتون میپردازیم.
هدف دوره آموزش Web Scraping با پایتون
برای یادگیری هر مهارتی به صورت دقیق و کامل، ما نیازمند یک دوره آموزشی جامع هستیم تا بتوانیم طبق راهبرد ها و اهداف آن برای کسب آن مهارت به صورت کامل پیش برویم. بر این اساس ما در کدیاد دوره آموزش وب اسکرپینگ را طراحی کردیم تا بتوانیم تجربه ها و یک آموزش کامل را در اختیار شما دانشجویان عزیز قرار دهیم.
پس از گذراندن این دوره، شما عزیزان به صورت کامل به مهارت استخراج داده (وب اسکرپینگ) مسلط خواهید شد تا بتوانید با روش های گوناگون با استفاده از این مهارت هرگونه داده ای را از یک وب سایت استخراج کنید.
کاربرد های وب اسکرپینگ
جمع آوری داده ها امروزه یکی از نیاز های بشریت است که هر فردی روزانه به حجم زیادی از این داده ها در سراسر اینترنت دسترسی دارد، که برخی مواقع ما علاقه مند به جمع آوری اینگونه داده ها هستیم. وب اسکرپینگ به دلیل کاربرد های بسیار زیادی که دارد این روزها مورد توجه بسیار زیادی قرار گرفته است که از جمله می توان به کاربرد های زیر اشاره کرد:
- تحلیل رقبا: با استخراج دادههای رقبا میتوان به تحلیل و بررسی استراتژیهای آنها پرداخت.
- تحلیل بازار: با جمعآوری دادههای مربوط به قیمت محصولات و نظرات مشتریان میتوان به تحلیل بازار و پیشبینی روندها پرداخت.
- خودکارسازی فرآیندها: با استفاده از وب اسکرپینگ میتوان بسیاری از فرآیندهای دستی و وقتگیر را خودکارسازی کرد.
معرفی دوره آموزش وب اسکرپینگ با پایتون
همه تلاش های ما در این دوره آموزشی کامل و جامع برای شما، بر این باور بوده است که بتوانیم این ابزار مهم را به صورت پروژه محور به شما عزیزان آموزش دهیم. دلیل اصلی پروژه محور بودن این دوره تسهیل فراگیری شما عزیزان می باشد تا بتوانید بعد از هر مبحث آن را به صورت عملی در پروژه خود استفاده کنید.
بیایید تا نگاهی به مراحل آموزش وب اسکرپینگ با پایتون بیندازیم:
- در فصل اول، شما پیش نیاز های اصلی این دوره را فرا خواهید گرفت. پیش نیازهایی همچون (نصب ابزار های مورد نیاز، پروتکل، کوکی ها و نشست ها و...) که قبل از شروع کار با وب اسکرپینگ لازم به دانستن آنها هستید.
- در فصل دوم، شروع کار با کتابخانه Request است که به شما اجازه استخراج داده ها نظیر (تصاویر کم حجم باینری، ویدیو ها، داده های دریافت شده از دیتابیس و… ) می دهد.
- در فصل سوم، شما با کتابخانه Beautiful Soap کار خواهید کرد که به آنالیز داده ها، تبدیل داده ها، ردیابی برخی داده ها می پردازید که شما در مبحث وب اسکرپینگ بسیار کمک خواهد کرد.
- در فصل چهارم و پنجم شما با فریم ورک های متعدد دیگری کار خواهید کرد که یک پله شما را در وب اسکرپینگ داده های گوناگون حرفه ای تر خواهد کرد.
مخاطبین دوره آموزش وب اسکرپینگ با پایتون چه کسانی هستند؟
این دوره آموزشی برای برنامه نویسان و توسعه دهندگان وب، تحلیلگران داده و افرادی که به دنبال جمع آوری داده های مختلف هستند، طراحی شده است. شما با گذراندن این دوره آموزشی پرکاربرد، میتوانید به یک پله بالاتر در حوزه برنامه نویسی پایتون صعود کنید. با شروع این دوره آموزشی جذاب پروژه محور، شما به وب اسکرپینگ کاملا مسلط خواهید شد و قادر به استخراج هر نوع داده ای از هر نوع وب سایتی خواهید بود.
پیشنیازهای دوره آموزش وب اسکرپینگ
برخی از دوره های آموزشی نیازمند داشتن پیش نیاز های از قبل هستند که به ما در پروسه یادگیری بسیار کمک میکنند و باعث تسریع روند آموزش خواهد شد. طبیعتا این دوره بسیار جذاب پیش نیاز اصلی آن زبان برنامه نویسی پایتون می باشد. بدین منظور که شما قبل از شروع این دوره ، و کار با ابزار وب اسکرپینگ اول باید دانش خوب و کافی از پایتون داشته باشید.
ما در پلتفرم آموزش برنامه نویسی کدیاد در قدم اول دوره مقدماتی تا پیشرفته پایتون را به شما معرفی میکنیم که نخست با گذراندن آن دوره بتوانید آشنایی کامل با این زبان را پیدا کنید و در ادامه به سراغ این مهارت جذاب بیایید.
ویژگیهای اصلی دوره آموزش وب اسکرپینگ با پایتون
اساسا یک دوره آموزشی جذاب و کارآمد، ویژگی های منحصر به فردی نسبت به دوره های دیگر دارد. ما در دوره آموزش وب اسکرپینگ با پایتون در کدیاد پشتیبانی کاملا رایگان توسط مدرس خواهیم داشت که دانشجویان عزیز در هر مرحله ای از یادگیری بتوانند با مدرس ارتباط داشته باشند. یکی دیگر از ویژگی های مهم این دوره آموزشی، جامع بودن و همچنین پروژه محور بودن این دوره می باشد که شما دانشجویان عزیز در طول دوره برای یادگیری بهتر این ابزار، پروژه های متعددی را توسعه خواهید داد.
چالش های وب اسکرپینگ
طبیعتا هر ابزار قدرتمندی به غیر از مزایا و ویژگی های جذابش، با چالش هایی هم روبرو می باشد که ابزار مهم وب اسکرپینگ هم به نوبه خودش با چالش های مهمی روبرو است از جمله:
- محدودیتهای قانونی: برخی وبسایتها سیاستهای مشخصی در مورد جمعآوری دادههای خود دارند و ممکن است اقدامات قانونی علیه وب اسکرپرها اتخاذ کنند.
- تغییرات ساختاری: ساختار صفحات وب ممکن است به مرور زمان تغییر کند که این امر نیاز به بروزرسانی کدهای اسکرپینگ را ایجاد میکند.
- مدیریت دادهها: حجم بزرگ دادههای استخراج شده نیازمند مدیریت و ذخیرهسازی مؤثر است.
سرفصل های دوره
توضیحاتی در مورد دوره و پشتیبانی دوره
گروه تلگرام (نحوه ارسال تمرین ها و پشتیبانی)
پیشنیاز و نصب ابزارهای مورد نیاز
پروتوکل http (Hypertext Transfer Protocol)
کوکی و کشینگ
ریکوئست هدر request header
متد GET & POST
شروع کار با requests
ارسال آرگومان یا داده به سمت get & post
دانلود عکس ها یا فایل های کم حجم باینری
دانلود فایل های باینری(ویدیو) با حجم بالا
کنترل و دور زدن محدودیت های request headers
api با متد GET (دریافت اطلاعات از api و ذخیره در دیکشنری)
تبدیل دیکشنری داده ها به فایل CSV
api با متد POST (ارسال JSON به سمت سرور)
ذخیره اطلاعات دریافت شده در دیتابیس
کوکی ها
نکاتی در مورد کوکی ها
نشست(session)
رویدادهای درخواست و پراکسی ها (event hook_proxy)
متد پست در api چت جی بی تی
نصب و آشنایی اولیه با bs
آنالیز داکیومنت
متد find وfind_all
متد find وfind_all پارت 2
سلکتور ها در bs
دریافت اطلاعات از جداول سایت etherscan
دریافت اطلاعات از جداول با pagination
تبدیل داده های اسکرپ شده به json
ردیاب قیمت بیتکویین در بایننس
پروژه 1: اسکرپ سایت باما قسمت (1)
پروژه 1: اسکرپ سایت باما قسمت (2)
پروژه 1: اسکرپ سایت باما قسمت (3)
پروژه 1: اسکرپ سایت باما قسمت (4)
پروژه 1: تبدیل داده های اسکرپ شده به فایل اکسل
عبارات با قاعده RegEx (1)
عبارات با قاعده RegEx (2)
عبارات با قاعده RegEx (3)
مثال regex با bs
پروژه 2: اسکرپ سایت دیجیکالا قسمت (1)_داینامیک رندرینگ
پروژه 2: اسکرپ سایت دیجیکالا قسمت (2)
پروژه 2: اسکرپ سایت دیجیکالا قسمت (3)
پروژه 2: اسکرپ سایت دیجیکالا قسمت (4)
پروژه 2: اسکرپ سایت دیجیکالا قسمت (5)_ساخت پایگاه داده
پروژه 2: اسکرپ سایت دیجیکالا قسمت (6)مدیریت خطا و ذخیره اطلاعات در پایگاه داده
معماری فریم ورک اسکرپی
ایجاد یک پروژه scrapy
اسپایدر
سلکتور ها در scrapy
ارسال آرگومان به سمت url
مثال blog
pagination در اسکرپی
آیتم ها در اسکرپی
مقدار دهی به آیتم ها
آیتم لودر
آیتم لودر اختصاصی
نکاتی مهم در مورد لودر ها
pipelines در اسکرپی (1)
pipelines در اسکرپی (2)
pipelines در اسکرپی (3)
pipelines در اسکرپی (4)
ورود به جزییات محصول با scrapy.request
کرالینگ جزییات با dictionary comprehension
دانلود فایل ها و عکس ها
آیتم برای عکس ها
شخصی سازی پایپ لاین های فایل و عکس
crawlspider
استخراج لینک ها با Link Extractors
Rule مدیریت وظیفه در crawlspider
pagination و استفاده از چند Rule در کرالر ها
جزییات صفحه با کرالر
اسپایدر میدلویر
دانلودر میدلویر (1)
دانلودر میدلویر (2)
نصب داکر و اسپلش برای رندر داینامیک
نحوه کار با splash در اسکرپی
پیشنیاز های دوره چه چیزهایی هستند؟
- آموزش رایگان پایتون (python)
- آموزش رایگان HTML و CSS از مقدماتی تا پیشرفته
نظرات دانشجویان
محسن سرابی |
دانشجوی دوره آموزش وب اسکرپینگ با پایتون
احمد علی پور |
دانشجوی دوره آموزش وب اسکرپینگ با پایتون
تشکر میکنم که چنین دوره فوق العاده ای رو ارئه دادید! سبک تدریس آقای دزیانیان بسیار حرفه ای و در عین حال شیوا و رسا است.
mahdi khoobroyan |
دانشجوی دوره آموزش وب اسکرپینگ با پایتون
من به تازگی دوره رو شروع کردم اما به خوبه می تونم با استاد ارتباط برقرار کنم امیدوارم بتونیم دوره خوبی داشته باشیم
...hamiedeh.mohammad |
دانشجوی دوره آموزش وب اسکرپینگ با پایتون
بسیار ممنونم بابت تدریس عالیتون ، ابهاماتی که درمورد این مبحث داشتم یکی یکی بادیدن آموزشهای شما داره برطرف میشه . خیلی حس خوبیه
مدرس دوره
سجاد دزیانیان
ذهنم تشنه تحلیل مسئله بود رفتم برنامه نویس شدم
با این که یک اقیانوس رو به روی من قرار گرفته
باز هم تشنه تمرین ، تفکر و تحلیل مسائل برنامه نویسیم
سوالات متداول
وب اسکرپینگ (Web Scraping) یک تکنیک قدرتمند در دنیای فناوری اطلاعات است که به استخراج دادهها از وبسایتها میپردازد. با استفاده از این روش، میتوان اطلاعات مختلفی مانند قیمت محصولات، نظرات کاربران، مقالات، تصاویر و سایر دادههای موجود در صفحات وب را به صورت خودکار جمعآوری کرد.
یکی از بهترین مزیت های این دوره آموزشی ، پروژه محور بودن آن است که به شما اجازه می دهد در طی فرایند آموزشی بصورت عملی هم از این ابزار استفاده کنید.
بدلیل طراحی برخی سیاست ها از سمت مدیریت هر وب سایتی و برای محافظت از داده ها و منحصر به فرد بودن آن ها، این ابزار در برخی مواقع با چالش های قانونی ، تغییرات ساختاری و مدیریت داده های بزرگ مواجه می شود.
پیش نیاز اصلی این دوره آموزشی، آشنایی با زبان برنامه نویسی پایتون می باشد.