18 نرم افزار اساسی که هر دانشمند داده ای باید درباره آن بداند

علم داده برای هر کسی است که دوست دارد چیزهای درهم تنیده را کشف کند و شگفتی های پنهان را در یک آشفتگی آشکار کشف کند.


مثل جستجو در سوزن در سوزن بلوز است. فقط دانشمندان داده ها نیازی به دست ندارند. آنها با استفاده از ابزارهای فانتزی با نمودارهای رنگارنگ ، و با جستجوی تعداد زیادی از شماره ها ، آنها را فقط در کله های خرابی داده فرو می روند و سوزن های ارزشمندی را در قالب بینش هایی از ارزش تجاری بالا پیدا می کنند.

غیر معمول دانشمند داده جعبه ابزار باید حداقل یک مورد از هر یک از این دسته ها را شامل شود: پایگاه داده های رابطه ای ، پایگاه داده های NoSQL ، چارچوب داده های بزرگ ، ابزارهای تجسم ، ابزارهای ضبط ، زبانهای برنامه نویسی ، IDE ها و ابزارهای یادگیری عمیق.

بانکهای اطلاعاتی رابطه ای

بانک اطلاعاتی رابطه ای ، مجموعه ای از داده های ساخت یافته در جداول با ویژگی ها است. جداول را می توان به یکدیگر پیوند داد ، روابط و محدودیت ها را تعریف کرد و آنچه را که یک مدل داده نامیده می شود ایجاد کرد. برای کار با بانکهای اطلاعاتی رابطه ای ، معمولاً از زبانی به نام SQL استفاده می کنید (ساختار جستجوی ساختاری).

برنامه هایی که ساختار و داده ها را در پایگاه های داده رابطه ای مدیریت می کنند RDBMS (سیستم های مدیریت ارتباط پایگاه داده) نامیده می شوند. چنین برنامه های کاربردی زیادی وجود دارد ، و متداول ترین آنها اخیراً شروع به تمرکز خود در زمینه علوم داده کرده اند ، و اضافه کردن قابلیت ها برای کار با مخازن بزرگ داده و به کار بردن تکنیک هایی از قبیل آنالیز داده ها و یادگیری ماشین..

سرور SQL

این یکی RDBMS مایکروسافت است که بیش از 20 سال با گسترش مداوم عملکرد شرکت خود در حال تحول است. SQL Server از نسخه 2016 خود ، مجموعه ای از خدمات را ارائه می دهد که شامل پشتیبانی از کد R تعبیه شده است. SQL Server 2017 با تغییر نام خدمات R خود به خدمات زبان ماشین و افزودن پشتیبانی از زبان پایتون ، شرط بندی را افزایش می دهد (اطلاعات بیشتر در مورد این دو زبان زیر).

با این اضافات مهم ، SQL Server دانشمندان داده را که ممکن است تجربه ای با Transact SQL نداشته باشند ، زبان جستجوی محلی مایکروسافت SQL Server را هدف قرار داده است..

SQL Server به دور از بودن یک محصول رایگان است. می توانید برای نصب آن روی ویندوز سرور مجوز بخرید (قیمت آن بسته به تعداد کاربران هم زمان متفاوت خواهد بود) یا از طریق سرویس آزمایشی Microsoft Azure از آن به عنوان یک سرویس مبتنی بر هزینه استفاده کنید.. یادگیری Microsoft SQL Server آسان است.

MySQL

در سمت نرم افزار منبع باز, MySQL تاج محبوبیت RDBMS را دارد. اگرچه در حال حاضر اوراکل مالک آن است ، اما هنوز هم طبق شرایط یک مجوز عمومی GNU رایگان و آزاد است. بیشتر برنامه های مبتنی بر وب به لطف مطابقت با استاندارد SQL از MySQL به عنوان مخزن داده استفاده می کنند.

همچنین کمک به محبوبیت آن روشهای نصب آسان آن ، جامعه بزرگ توسعه دهندگان ، تعداد اسناد جامع و ابزارهای شخص ثالث مانند phpMyAdmin است که فعالیتهای مدیریت روزمره را ساده تر می کند. اگرچه MySQL هیچ وظیفه بومی برای انجام تجزیه و تحلیل داده ها ندارد ، اما باز بودن آن اجازه می دهد تا تقریباً با هرگونه ابزار تجسم ، گزارش دهی و هوشمندی شغلی که ممکن است انتخاب کنید ادغام شود.

PostgreSQL

یکی دیگر از گزینه های منبع باز RDBMS است PostgreSQL. گرچه PostgreSQL به اندازه MySQL محبوب نیست ، از انعطاف پذیری و توسعه پذیری و پشتیبانی از پرس و جوهای پیچیده متمایز است ، مواردی که فراتر از گفته های اساسی مانند SELECT ، WHERE و GRUP BY هستند..

این ویژگی ها باعث می شود که در بین دانشمندان داده محبوبیت بیشتری پیدا کند یکی دیگر از ویژگی های جالب پشتیبانی از محیط های چند محیط است ، که امکان استفاده از آن در محیط های ابری و پیش فرض و یا ترکیبی از هر دو را می دهد ، که معمولاً به عنوان محیط ابر ترکیبی شناخته می شوند..

PostgreSQL قادر است پردازش تحلیلی بصورت آنلاین (OLAP) را با پردازش معاملات آنلاین (OLTP) ترکیب کند ، و به روشی بنام پردازش / تحلیلی ترکیبی / تحلیلی ترکیبی (HTAP) کار کند. همچنین به لطف اضافه کردن PostGIS برای داده های جغرافیایی و JSON-B برای اسناد ، کار با داده های بزرگ نیز مناسب است. PostgreSQL همچنین از داده های بدون ساختار پشتیبانی می کند ، که اجازه می دهد تا در هر دو دسته باشد: بانک اطلاعاتی SQL و NoSQL.

پایگاه داده های NoSQL

این نوع مخزن داده ها همچنین به عنوان پایگاه های داده غیر مرتبط نیز شناخته می شوند و دسترسی سریع تری به ساختار داده های غیر جدولی دارند. برخی از نمونه های این ساختارها نمودارها ، اسناد ، ستونهای گسترده ، مقادیر کلیدی در میان بسیاری دیگر است. فروشگاه های داده NoSQL می توانند قوام داده ها را به نفع مزایای دیگر ، از جمله در دسترس بودن ، تقسیم بندی و سرعت دسترسی کنار بگذارند..

از آنجا که SQL در فروشگاه های داده NoSQL وجود ندارد ، تنها راه برای جستجوی این نوع پایگاه داده استفاده از زبان های سطح پایین است و هیچ زبانی وجود ندارد که به اندازه SQL پذیرفته شود. علاوه بر این ، هیچ استاندارد استاندارد برای NoSQL وجود ندارد. به همین دلیل ، به طعم جالب ، برخی از بانکهای اطلاعاتی NoSQL شروع به افزودن پشتیبانی از اسکریپت های SQL می کنند.

MongoDB

MongoDB یک سیستم پایگاه داده محبوب NoSQL است که داده ها را در قالب اسناد JSON ذخیره می کند. تمرکز آن بر مقیاس پذیری و انعطاف پذیری برای ذخیره داده ها به روشی غیر ساختار یافته است. این بدان معنی است که هیچ لیست فیلد ثابت وجود ندارد که باید در تمام عناصر ذخیره شده مشاهده شود. علاوه بر این ، ساختار داده را می توان با گذشت زمان تغییر داد ، چیزی که در یک پایگاه داده رابطه ای حاکی از خطر بالای تأثیرگذاری بر برنامه های در حال اجرا است.

این فناوری در MongoDB برای نمایه سازی ، نمایش داده شدگان موقت و تجمیع فراهم می کند که پایه و اساس محکمی برای تجزیه و تحلیل داده ها می باشد. ماهیت توزیع شده پایگاه داده بدون نیاز به ابزارهای پیشرفته ، در دسترس بودن ، مقیاس بندی و توزیع جغرافیایی بسیار را فراهم می کند.

ردیس

این یکی گزینه دیگر در متن باز ، جلوی NoSQL است. در اصل یک فروشگاه ساختار داده است که در حافظه فعالیت می کند و علاوه بر ارائه خدمات بانک اطلاعاتی ، به عنوان کارگزار حافظه حافظه نهان و پیام دهنده نیز فعالیت می کند..

این پشتیبانی از بی شمار ساختارهای داده غیر متعارف ، از جمله هش ها ، فهرستهای مکانی ، لیستها و مجموعههای مرتب شده را پشتیبانی می کند. این به دلیل عملکرد بالا در کارهایی با داده های فشرده مانند محاسبات تقاطع های مجموعه ، مرتب سازی لیست های طولانی یا ایجاد رتبه بندی های پیچیده ، به خوبی برای علوم داده مناسب است. دلیل عملکرد برجسته Redis عملکرد حافظه آن است. می توان پیکربندی کرد که داده ها به صورت انتخابی باقی بماند.

چارچوب های Big Data

فرض کنید شما باید داده هایی را که کاربران فیس بوک در طی یک ماه تولید می کنند ، تجزیه و تحلیل کنید. ما در مورد عکس ها ، فیلم ها ، پیام ها و همه آن صحبت می کنیم. با توجه به اینکه روزانه بیش از 500 ترابایت داده توسط کاربران آن به شبکه اجتماعی اضافه می شود ، دشوار است که حجم ارائه شده توسط یک ماه کل داده های آن را اندازه گیری کنید.

برای دستکاری در حجم عظیم داده ها به روشی مؤثر ، به یک چارچوب مناسب نیاز دارید که بتواند آمارها را بیش از یک معماری توزیع شده محاسبه کند. دو قاب وجود دارد که بازار را هدایت می کند: Hadoop و Spark.

هادوپ

به عنوان یک چارچوب بزرگ داده, هادوپ با پیچیدگی های مربوط به بازیابی ، پردازش و ذخیره انبوهی از داده ها سروکار دارد. Hadoop در یک محیط توزیع شده ، متشکل از خوشه های رایانه ای که الگوریتم های ساده را پردازش می کنند ، کار می کند. یک الگوریتم ارکسترینگ به نام MapReduce وجود دارد که کارهای بزرگ را به قسمت های کوچک تقسیم می کند و سپس آن دسته از کارهای کوچک را بین خوشه های موجود توزیع می کند..

Hadoop برای مخازن داده های صنفی سازمانی که نیاز به دسترسی سریع و در دسترس بودن زیاد دارند ، توصیه می شود که همه در یک طرح کم هزینه است. اما شما به یک مدیر لینوکس با عمق نیاز دارید دانش هادوپ برای حفظ چارچوب و اجرای آن.

جرقه

Hadoop تنها چارچوبی برای دستکاری داده های بزرگ نیست. نام بزرگ دیگر این منطقه است جرقه. موتور Spark برای پیشی گرفتن از Hadoop از نظر سرعت و سهولت استفاده از آن طراحی شده است. ظاهراً به این هدف دست یافته است: برخی از مقایسه ها می گویند اسپارک در هنگام کار روی دیسک 10 برابر سریعتر از Hadoop و 100 بار سریعتر در حافظه کار می کند. همچنین برای پردازش همان مقدار داده به تعداد ماشینهای کمتری نیز نیاز دارد.

علاوه بر سرعت ، یکی دیگر از مزایای اسپارک پشتیبانی از پردازش جریان است. این نوع پردازش داده ها ، که پردازش در زمان واقعی نیز نامیده می شود ، شامل ورودی و خروجی مداوم داده ها است.

ابزارهای تجسم

یک شوخی رایج بین دانشمندان داده می گوید ، اگر داده ها را به اندازه کافی طولانی شکنجه کنید ، آن چیزی را که باید بدانید اعتراف می کند. در این حالت ، “شکنجه” به معنای دستکاری داده ها با تبدیل و فیلتر کردن آن ، برای بهتر دیده شدن آن است. و این جایی است که ابزارهای تجسم داده به صحنه می آیند. این ابزارها داده های از پیش پردازش شده را از چندین منبع می گیرند و حقایق آشکار شده آن را به شکل های گرافیکی و قابل درک نشان می دهند.

صدها ابزار وجود دارد که در این گروه قرار می گیرند. آن را دوست دارم یا نه ، بیشترین کاربرد مایکروسافت اکسل و ابزارهای نمودار آن است. نمودارهای اکسل برای هر کسی که از اکسل استفاده می کند قابل دسترسی است ، اما قابلیت های محدودی دارند. همین مورد در مورد سایر برنامه های صفحه گسترده مانند Google Sheets و Libre Office نیز صدق می کند. اما ما در اینجا در مورد ابزارهای خاص تر ، ویژه برای هوش تجاری (BI) و تجزیه و تحلیل داده ها صحبت می کنیم.

برق BI

چندی پیش مایکروسافت نسخه خود را منتشر کرد برق BI برنامه تجسم این می تواند از منابع متنوعی مانند پرونده های متنی ، پایگاه داده ها ، صفحات گسترده و بسیاری از سرویس های داده آنلاین از جمله فیس بوک و توییتر استفاده کند و از آن برای تولید داشبورد بسته بندی شده با نمودارها ، جداول ، نقشه ها و بسیاری از اشیاء تجسم دیگر استفاده کند. اشیاء داشبورد تعاملی هستند به این معنی که می توانید بر روی یک سری داده در یک نمودار کلیک کنید تا آن را انتخاب کرده و از آن به عنوان فیلتر برای سایر اشیاء موجود در برد استفاده کنید..

Power BI ترکیبی از یک برنامه دسک تاپ ویندوز (بخشی از مجموعه Office 365) ، یک برنامه وب و یک سرویس آنلاین برای انتشار داشبورد در وب و به اشتراک گذاری آنها با کاربران است. این سرویس به شما امکان ایجاد مجوزها را می دهد تا فقط به افراد خاص دسترسی به تابلوها را داشته باشید.

تابلو

تابلو گزینه دیگری برای ایجاد داشبورد تعاملی از ترکیبی از چندین منبع داده است. همچنین یک نسخه دسک تاپ ، یک نسخه وب و یک سرویس آنلاین برای اشتراک گذاری داشبورد شما ایجاد می کند. این کار به طور طبیعی “با روشی که شما فکر می کنید” کار می کند (همانطور که ادعا می شود) ، و استفاده از آن برای افراد غیر فنی آسان است ، که از طریق بسیاری از آموزش ها و فیلم های آنلاین بهبود یافته است..

برخی از برجسته ترین ویژگی های Tableau اتصالات داده نامحدود ، داده های زنده و حافظه آن و طراحی های بهینه شده در موبایل است.

QlikView

QlikView رابط کاربری تمیز و ساده ای را ارائه می دهد تا به تحلیلگران کمک کند تا بینش جدیدی از داده های موجود را از طریق عناصر بصری کشف کنند که به راحتی برای همه قابل درک است.

این ابزار به دلیل یکی از انعطاف پذیر ترین سیستم عامل های هوش تجاری شناخته شده است. این ویژگی ویژگی ای به نام جستجوی مشارکتی را فراهم می کند ، که به شما کمک می کند تا روی مهمترین داده ها متمرکز شوید و در زمان لازم برای یافتن آن به صورت اختصاصی ، صرفه جویی کنید.

با QlikView ، می توانید در زمان واقعی با همکاران همکاری کنید و تجزیه و تحلیل مقایسه ای انجام دهید. تمام داده های مرتبط را می توان در یک برنامه با ویژگی های امنیتی که دسترسی به داده ها را محدود می کند ، ترکیب کرد.

ابزارهای خراش دادن

در زمان هایی که اینترنت تازه ظهور کرده بود ، خزندگان وب به همراه شبکه هایی که اطلاعات خود را جمع می کردند ، به همه راه سفر کردند. با تکامل فناوری ، اصطلاح خزیدن وب برای ضبط وب تغییر کرد ، اما هنوز هم به همین معنی است: به طور خودکار اطلاعات از وب سایت ها استخراج می شود. برای انجام وبلاگ نویسی ، از فرآیندهای خودکار یا رباتهایی استفاده می کنید که از یک صفحه وب به دیگری پرش می کنند ، داده ها را از آنها استخراج می کنید و آن را به قالب های مختلف صادر می کنید یا برای تجزیه و تحلیل بیشتر از آن در پایگاه های داده وارد می کنید..

در زیر ویژگی های سه پرطرفدارترین پرینتر وب موجود امروز را خلاصه می کنیم.

هشت پا

هشت پا scraper web ویژگی های جالبی را ارائه می دهد ، از جمله ابزارهای داخلی برای بدست آوردن اطلاعات از وب سایت هایی که کار با خود را آسان نمی کنند. این یک برنامه دسک تاپ است که نیازی به کد نویسی ندارد ، با یک رابط کاربر پسند که امکان تجسم فرایند استخراج را از طریق یک طراح گردش گرافیکی فراهم می کند..

همراه با برنامه مستقل ، Octoparse یک سرویس مبتنی بر ابر را برای سرعت بخشیدن به روند استخراج داده ها ارائه می دهد. کاربران می توانند هنگام استفاده از سرویس ابری به جای برنامه دسک تاپ ، سرعت 4x تا 10x افزایش سرعت را تجربه کنند. اگر به نسخه دسک تاپ می چسبید ، می توانید به طور رایگان از Octoparse استفاده کنید. اما اگر ترجیح می دهید از سرویس ابری استفاده کنید ، باید یکی از برنامه های پرداخت شده آن را انتخاب کنید.

Grabber محتوا

اگر به دنبال یک ابزار قراضه غنی از ویژگی هستید ، باید مورد توجه قرار دهید Grabber محتوا. بر خلاف Octoparse ، برای استفاده از Content Grabber ، مهارت های برنامه نویسی پیشرفته ای ضروری است. در عوض ، شما در حال ویرایش اسکریپت ، رابط کاربری اشکال زدایی و سایر قابلیت های پیشرفته هستید. با استفاده از Content Grabber ، می توانید از زبانهای .Net برای نوشتن عبارات منظم استفاده کنید. به این ترتیب ، لازم نیست عبارات را با استفاده از یک ابزار داخلی تولید کنید.

این ابزار API (رابط برنامه نویسی برنامه) ارائه می دهد که می توانید برای اضافه کردن قابلیت scraping به دسک تاپ و برنامه های وب خود استفاده کنید. برای استفاده از این API ، توسعه دهندگان باید به سرویس Content Grabber Windows دسترسی پیدا کنند.

پارس هاب

این اسکرابر می توانید لیست گسترده ای از انواع مختلف محتوا ، از جمله انجمن ها ، نظرات تو در تو ، تقویم ها و نقشه ها را کنترل کنید. همچنین می تواند با صفحاتی که شامل احراز هویت ، Javascript ، Ajax و موارد دیگر است برخورد کند. ParseHub می تواند به عنوان یک برنامه وب یا یک برنامه دسک تاپ با قابلیت اجرا بر روی ویندوز ، macOS X و Linux استفاده شود.

مانند Content Grabber ، توصیه می شود که از دانش برنامه نویسی برای استفاده بیشتر از پارس هاب استفاده کنید. این یک نسخه رایگان ، محدود به 5 پروژه ، و 200 صفحه در هر اجرا است.

زبانهای برنامه نویسی

دقیقاً مانند زبان SQL که قبلاً ذکر شده به طور خاص برای کار با بانکهای اطلاعاتی رابطه طراحی شده است ، زبانهای دیگری نیز وجود دارند که با تمرکز روشنی روی علم داده ایجاد می شوند. این زبانها به توسعه دهندگان اجازه می دهند برنامه هایی بنویسند که با تجزیه و تحلیل داده های گسترده مانند آمار و یادگیری ماشینی سروکار دارند.

SQL همچنین یک مهارت مهمی محسوب می شود که توسعه دهندگان باید دانش داده را انجام دهند ، اما به این دلیل است که بیشتر سازمان ها هنوز داده های زیادی را در مورد پایگاه های داده رابطه دارند. زبانهای علمی “درست” R و Python هستند.

پایتون

پایتون یک زبان برنامه نویسی سطح بالا ، تفسیر شده با هدف کلی است که به خوبی برای توسعه سریع برنامه مناسب است. این یک ترکیب ساده و آسان برای یادگیری نحو است که اجازه می دهد تا یک منحنی یادگیری شیب دار و کاهش هزینه های نگهداری برنامه باشد. دلایل زیادی وجود دارد که چرا این زبان ارجح برای علم داده است. به ذکر چند مورد: پتانسیل نوشتن ، شفافیت ، قابلیت حمل و عملکرد.

این زبان نقطه شروع خوبی برای دانشمندان داده است که قصد دارند قبل از پرش به کارهای خرد واقعی و سخت داده ها ، آزمایش های زیادی انجام دهند ، و کسانی که می خواهند برنامه های کاملی را توسعه دهند.

ر

زبان R عمدتا برای پردازش و نمودار آماری داده ها مورد استفاده قرار می گیرد. اگرچه به معنای توسعه برنامه های کاربردی تمام عیار نیست ، همانطور که برای Python نیز وجود دارد ، R به دلیل پتانسیل موجود در داده کاوی و تجزیه و تحلیل داده ها در سالهای اخیر بسیار محبوب شده است..

با تشکر از یک کتابخانه در حال رشد از بسته های آزادانه در دسترس که قابلیت های آن را گسترش می دهد ، R قادر به انجام انواع کارهای پردازش داده ها از جمله مدل سازی خطی / غیر خطی ، طبقه بندی ، آزمایش های آماری و غیره است..

یادگیری این زبان آسان نیست ، اما هنگامی که با فلسفه آن آشنا شدید ، مانند یک حرفه ای اقدام به انجام محاسبات آماری خواهید کرد.

شناسه ها

اگر به طور جدی فکر می کنید خود را به علم داده اختصاص دهید ، باید یک محیط توسعه یکپارچه (IDE) را متناسب با نیازهای خود انتخاب کنید ، زیرا شما و IDE وقت زیادی را برای کار در کنار هم می گذرانید.

یک IDE ایده آل باید تمام ابزارهای مورد نیاز خود را در کار روزانه خود به عنوان رمزگذار جمع کند: یک ویرایشگر متن با برجسته سازی نحو و تکمیل خودکار ، یک اشکال زدا قدرتمند ، یک مرورگر شی و دسترسی آسان به ابزارهای خارجی. علاوه بر این ، باید با زبان مورد نظر شما سازگار باشد ، بنابراین ایده خوبی است که IDE خود را پس از دانستن از کدام زبانی استفاده کنید..

Spyder

این generic IDE بیشتر برای دانشمندان و تحلیلگرانی که نیاز به کدگذاری دارند نیز در نظر گرفته شده است. برای راحت تر ساختن آنها ، خود را محدود به قابلیت IDE نمی کند – همچنین ابزارهایی را برای اکتشاف داده ها و تجسم و اجرای تعاملی فراهم می کند ، همانطور که می توان در یک بسته علمی یافت. ویرایشگر Spyder از چندین زبان پشتیبانی می کند و یک مرورگر کلاس ، تقسیم پنجره ، پرش به تعریف ، تکمیل کد خودکار و حتی یک ابزار تجزیه و تحلیل کد را اضافه می کند.

این اشکال زدایی به شما کمک می کند تا هر خط کد را به صورت تعاملی ردیابی کنید ، و یک پروفایل به شما کمک می کند تا ناکارآمدی ها را بیابید و از بین ببرید.

PyCharm

اگر در پایتون برنامه دارید ، احتمال دارد که IDE مورد نظر شما انتخاب شود PyCharm. دارای ویرایشگر کد هوشمند با جستجوی هوشمند ، تکمیل کد ، و تشخیص و رفع خطا. تنها با یک کلیک ، می توانید از ویرایشگر کد به هر پنجره مربوط به متن ، از جمله تست ، روش فوق العاده ، اجرای ، اعلامیه و موارد دیگر بپردازید. PyCharm از آناکوندا و بسیاری از بسته های علمی مانند NumPy و Matplotlib پشتیبانی می کند تا فقط دو مورد از آنها را ذکر کند.

این برنامه با مهمترین سیستمهای کنترل نسخه و همچنین با یک تستر ، یک پروفایل و یک اشکال زدایی ادغام می شود. برای بستن این معامله ، همچنین با Docker و Vagrant یکپارچه شده است تا بتواند از طریق سیستم عامل متقابل و کانتینرزاسیون متقاطع فراهم شود.

RStudio

برای آن دسته از دانشمندان داده هایی که تیم R را ترجیح می دهند ، IDE مورد نظر باید باشد RStudio, به دلیل ویژگیهای زیادی که دارد می توانید آن را بر روی دسک تاپ با Windows ، macOS یا Linux نصب کنید ، یا اگر نمی خواهید محلی آن را نصب کنید ، می توانید آن را از یک مرورگر وب اجرا کنید. هر دو نسخه مواردی مانند برجسته سازی نحو ، برجستگی هوشمند و تکمیل کد را ارائه می دهند. یک نمایشگر داده یکپارچه وجود دارد که هنگام مرور اطلاعات جدولی می تواند مفید باشد.

حالت اشکال زدایی امکان مشاهده چگونگی به روزرسانی داده ها هنگام اجرای یک برنامه یا اسکریپت مرحله به مرحله را می دهد. برای کنترل نسخه ، RStudio ادغام پشتیبانی از SVN و Git. یک امتیاز خوب امکان نوشتن گرافیک های تعاملی ، با براق و ارائه کتابخانه ها است.

جعبه ابزار شخصی شما

در این مرحله ، شما باید دید کاملی از ابزارهایی که باید بدانید برای برتری در علم داده است. همچنین ، ما امیدواریم که شما اطلاعات کافی در اختیار شما قرار دهیم تا تصمیم بگیرید که مناسب ترین گزینه در هر دسته از ابزارها است. اکنون به شما بستگی دارد. علوم داده ها یک زمینه شکوفایی بود توسعه حرفه ای. اما اگر می خواهید این کار را انجام دهید ، باید از تغییرات روندها و فناوری ها پیروی کنید ، زیرا تقریباً بطور روزانه اتفاق می افتند.

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map