[ad_1]

امروزه متخصصان داده به موارد دیگری بیش از هوش مصنوعی و پایتون نیاز ندارند. سازمان ها به دنبال متخصصانی هستند که در مجموعه C نیز احساس کنند در خانه خود هستند.

اعتبار: Maxim Yemelyanov از طریق Adobe Stock

اعتبار: Maxim Yemelyanov از طریق Adobe Stock

اداره آمار کار مشاغل علوم داده را در 15 شغل با رشد سریع رشد می کند ، که تخمین زده می شود طی 10 سال آینده 31 درصد رشد داشته باشد. از آنجا که داده ها بیشتر به حیات حیات همه سازمان ها تبدیل می شوند ، دانشمندان داده نه تنها به مهارت های فنی صحیح بلکه به تجارب تجاری نیز نیاز دارند.

یادگیری ماشین / شبکه های عصبی

در سال 2021 ، روش های یادگیری ماشین مانند یادگیری انتقال و ترانسفورماتورها توجه بسیاری را به خود جلب می کنند زیرا به سرعت نوآوری را در تعدادی از فضاهای مختلف تحریک می کنند. PyTorch جنبش زیادی در پشت ساخت و آموزش شبکه های عصبی دارد و از Keras و TensorFlow نیز اغلب استفاده می شود.

همچنین یک اکوسیستم غنی از کتابخانه های نرم افزار ، بسیار منبع باز وجود دارد که می تواند به تسریع یادگیری ماشین و برنامه های علوم داده کمک کند.

متیو سیلور ، مدیر ارشد علوم ، برای داده ها در Vectra ، یک شرکت هوش مصنوعی برای متخصصان شناسایی و پاسخ به تهدیدها. “ONNX ، یک استاندارد شبکه عصبی که اجرای مستقل از بسترهای نرم افزاری ، کتابخانه ای و زبان را تسهیل می کند ، به ما کمک کرده تا استفاده از هوش مصنوعی را در تولید ساده کرده و کار مدل سازی خود را تسریع کنیم.”

برنامه نويسي

برای دانشمندان داده نوشتن کد با کیفیت و قابل کنترل برای تجزیه و تحلیل اکتشافی ، پیش پردازش داده ها و آموزش الگوریتم ها و در برخی موارد برای پیاده سازی مدل ها در تولید بسیار مهم است. Python ، JavaScript ، R و Scala بهترین زبان های توسعه هستند. مهارت مفید دیگر درک چگونگی ساخت Web API از طریق مدل های خود است که دیگران می توانند پیاده سازی کنند.

سیلور گفت: “دانشمندان داده که می توانند کار خود را ادامه دهند و بلافاصله از کتابخانه های نرم افزار معمولی برای ساخت مدل استفاده کنند ، رقابتی ترین هستند و مهارت های قوی توسعه نرم افزار تقریباً در هر مورد یک امتیاز محسوب می شود.

زیرساخت ابر

دانشمندان داده با درک اصول مهندسی ابر و زیرساخت های ابر برای بسیاری از کارفرمایان جذاب هستند. این به این معنی است که با یکی از سه بزرگ ارائه دهنده ابر عمومی – مایکروسافت ، سرویس های وب آمازون یا Google احساس راحتی می کنید. هر یک از آنها مجموعه کاملی از ابزارها را برای محققان داده برای بازیابی داده ها ، تمیز کردن داده ها ، تجسم و یادگیری ماشین ارائه می دهد.

فیلیپ گیتس-ایدم ، معمار ارشد JupiterOne ، ارائه دهنده راه حل های مدیریت دارایی های سایبری ، گفت: “من شخصاً به دنبال متخصصان داده هستم که با زیرساخت های ابری ، خطوط لوله CI / CD و اتوماسیون آشنا باشند.” “دانشمندان داده باید درک روشنی از نحوه ساخت و استفاده از ابزارهای زیرساخت ابر داشته باشند.”

آمار

آمار ، رشته ای از ریاضیات است که به دنبال جمع آوری و تفسیر داده های کمی با استفاده از مدل ها و نمایش ها برای یک مجموعه داده خاص است ، در هسته اصلی علم داده قرار دارد و شامل مفاهیمی مانند احتمال ، تنوع ، رگرسیون و روند اصلی است.

“اگر دانش کاملی از آمار – قلب علم داده – و نحوه بکار بردن استدلال ریاضی صحیح در مورد مشکلی که روی آن کار می کنید ندارید ، برای من مهم نیست که چند سیستم عامل یا زبان می توانید لارس کممن ، معمار ارشد ، در شرکت مشاور فناوری اطلاعات نتریکس گفت: “من فکر می کنم این یک چالش در صنعت در حال حاضر است – ما رزومه های زیادی از افرادی می گیریم که برای یادگیری روش علمی کار سختی انجام نداده اند.”

مدیریت پروژه

از آنجا که پروژه های علوم داده می توانند شامل مراحل طولانی تحقیق و همچنین بسیاری از ناشناخته ها حتی در پایان بازی باشند ، مدیریت پروژه مهارت کلیدی دیگری برای دانشمندان داده است. به عنوان مثال ، اتخاذ یک روش انعطاف پذیر ، به دانشمندان داده اجازه می دهد تا اولویت ها را تعیین کرده و نقشه های راه را بر اساس الزامات و اهداف ایجاد کنند.

سیلور توضیح داد: “پیش بینی زمان توسعه و آموزش یک مدل یادگیری ماشین اغلب دشوار است و شرکت هایی که منتظر مدل یا نتایج به روز شده هستند اغلب مهلت و برنامه ریزی دارند که از این غیرقابل پیش بینی رنج می برند.” “دانشمندان داده ، که می توانند با درک محدودیت ها از همان ابتدا تلاش اصلی مدل سازی را به دست آورند ، وضعیت پروژه را به عنوان پیشرفت تلاش اعلام می کنند و پیش بینی می کنند چه زمانی می توانند قرائت معنادار بعدی را ارائه دهند ، تیم ما “

روایت / تجسم داده ها

اگرچه داده های یک سازمان ممکن است دارای مقادیر قابل توجهی از ارزش بالقوه باشد ، اما هیچ ارزشی نمی تواند ایجاد شود ، مگر اینکه بتوانید این بینش ها را فاش کنید و سپس آنها را به اقدامات یا نتایج تجاری تبدیل کنید. به طور خلاصه ، Tableau و D3 از بهترین ابزارها برای تجسم دانش داده و بیان داستانهای مورد تقاضا هستند.

کممن گفت: “هنگامی که مشتری شما متوجه نمی شود شما چه کاری انجام می دهید ، آسان است که کاری را که انجام می دهید دست کم بگیرید ، به خصوص در مرحله آماده سازی داده ها.” “یک توضیح واضح از روند کار و مزایای هر مرحله به زبانی که مخاطب شما می تواند با آن ارتباط برقرار کرده و از آن پشتیبانی کند ، در صورت امکان ، از طریق تجسم داده های مناسب ، بخشی اساسی از نقش شماست.”

ارتباطات

دانشمندان داده اکنون بیش از هر زمان دیگری “در کنار هم” بودن داده ها را دارند ، اما این نیاز به درک دقیق اهداف تجاری و توانایی برقراری ارتباط واضح با اصطلاحات فنی دارد. دانشمندان داده که می توانند داده ها را به عبارات مفید ترجمه کنند افرادی هستند که قادر به افزودن این ارزش افزوده هستند.

“توانایی ترجمه این داده ها به اطلاعات تمیز و قابل هضم تجاری یک مهارت عظیم خواهد بود و دانشمندان داده همیشه این مهارت نرم یا تجربه نشستن در اتاق مدیر را ندارند و می توانند روند تصمیم گیری خود را روشن کنند.” جوشوا درو. ، مدیر منطقه ای در شرکت کارکنان فناوری اطلاعات رابرت Half Technology گفت.

مطالب مرتبط:

چگونه و چرا مشاغل باید با هوش مصنوعی اخلاقی کنار بیایند
رصدخانه روبین با جمع آوری داده های کهکشانی منبع باز افتتاح می شود
اصول یادگیری ماشینی همه باید بدانند
چگونه شرکت ها NLP خود را توسعه می دهند

ناتان ادی نویسنده مستقل هفته اطلاعات است. او برای مکانیک های معروف ، مدیریت فروش و مجله بازاریابی ، FierceMarkets و CRN ، و دیگران نوشت. در سال 2012 ، او اولین مستند خود را با عنوان “ستون گمشده” ساخت. وی هم اکنون در برلین زندگی می کند. بیوگرافی کامل را مشاهده کنید

ما از نظرات شما در مورد این موضوع در کانال های رسانه های اجتماعی خود استقبال می کنیم ، یا [contact us directly] با س questionsال در مورد سایت.

مقالات بیشتر



[ad_2]

منبع: tasiveh-news.ir