FanGraphs یک پایگاه داده را در ابر علامت گذاری می کند تا با نمایش بزرگ همراه شود


وب سایت تجزیه و تحلیل بیس بال به MariaDB SkySQL مراجعه کرد زیرا به نظر می رسد از داده های بیشتری در مورد بازی ها از منابع محلی و بین المللی استفاده می کند.

وب سایت تجزیه و تحلیل داده های بیس بال ، FanGraphs به تازگی پایگاه داده ابر MariaDB SkySQL را برای کار با اطلاعات در حال تغییر و رو به رشد از این ورزش تصویب کرده است. FanGraphs ، که داده های مفصلی از جمله سرعت میدان پرتاب شده در حین بازی ها را جمع آوری می کند ، از پایگاه داده ابری برای پردازش آمار ، پرس و جوهای پیچیده ، پیش بینی ها و مدل های ضریب پخش استفاده می کند.

دیوید آپلمن ، مدیر عامل و بنیانگذار FanGraphs ، گفت: “ما همه موارد بیس بال را بررسی خواهیم کرد.”

حالا که فصل بیس بال لیگ برتر 2021 در حال انجام است ، او می گوید داده های جدید Statcast توسط لیگ معرفی شده است که باید جایگزین شود. اپلمن می گوید: “داده ها می توانند بسیار گسترده باشند.” “تعداد زیادی رکورد برای هر رویدادی که در بیس بال اتفاق می افتد وجود دارد. در سطح فصل ، چیزی در قلمرو یک میلیون رکورد در هر فصل برای داده ها برای هر قسمت جداگانه وجود دارد. “

تصویر: الکس - stock.Adobe.com

تصویر: الکس – stock.Adobe.com

همچنین داده هایی از تیم های لیگ های کوچک و همچنین لیگ های بیس بال خارج از کشور وجود دارد که توسط FanGraphs جذب می شوند. “این داده های زیادی است.” اپلمن می گوید: FanGraphs تمایل دارد در هر ثانیه هزاران پرس و جو را در پایگاه داده خود اجرا كند. وی می گوید ، افزودن داده های بین المللی بیشتر برای FanGraphs در اولویت است ، همچنین داده های بیشتر Statcast از MLB.

آپلمن در سال 2005 تاسیس شد و می گوید كه وی شخصاً پایگاه داده FanGraphs را تا سال 2019 مدیریت كرده است. طی سالهای گذشته ، شركت وی تلاش كرده است تا با منابع مختلف كار كند تا نتایج خود را با نتایج متفاوت بهبود بخشد. به گفته اپلمن ، FanGraphs ابتدا حدود 7 سال پیش به MariaDB مهاجرت كرد ، سپس به بررسی مهاجرت به لینوكس پرداخت ، اما این امر منجر به چندین سردرد احتمالی شد. او می گوید: “من نمی خواستم مهاجرت انجام دهم.” “بهینه سازی پایگاه داده ویندوز یک چیز است. بهینه سازی آن روی جعبه لینوکس چیز کاملاً متفاوتی است. “

آپلمان می گوید که وقت انجام این کار را نداشته است ، در حالی که سایر عملیات نیاز به توجه دارد. FanGraphs گزینه های دیگری مانند انتقال پایگاه داده به یک راه حل کلیدی را نیز در نظر گرفت. او می گوید: “من به سرویس پایگاه داده رابطه آمازون و Cloud SQL نگاه کردم.”

در زمانی که FanGraphs سعی داشت کل مدیریت پایگاه داده خود را جابجا و تخلیه کند ، Appelman دستورالعمل فنی درباره MariaDB SkySQL را دریافت کرد ، که امکانات جدیدی را ایجاد کرد. “سریع بود. به نظر می رسید که او قادر به پاسخگویی به تمام نیازهای من است. “

FanGraphs قراردادی را با MariaDB امضا کرد تا ابتدا به لینوکس مهاجرت کند و سپس در فوریه سال جاری به SkySQL مهاجرت کند. این امر همچنین منجر به انتقال FanGraphs از سرورهای اختصاصی به Google Cloud Platform شد. اپلمن می گوید: “ما فقط به انعطاف پذیری بیشتری نیاز داشتیم.” انتقال زیرساخت ها به GCP شامل سرورهای برنامه و سرورهای داده است.

این اولین تلاش FanGraphs برای استفاده از ابر نبود. در سال 2017 ، شرکت تلاش کرد تا به یک ارائه دهنده ابری کوچکتر مهاجرت کند ، به گفته اپلمان ، سعی در تطبیق منابع دقیق مانند RAM و قدرت پردازش دارد. وی گفت: “ما مشکلات بزرگی داشته ایم.” “من باید صبح روز بعد مهاجرت کنم. چیزی که من کاملاً متوجه نبودم این بود که با خدمتی که به آن نقل مکان کردم ، hypervisor باعث ورود و ورود به سیستم منفی شدیدی شد. پایگاه داده به این دشواری عظیم تبدیل شد. “

آپلمن می گوید که به دلیل منحنی یادگیری که با منابعش روبرو است ، تمایلی به انتقال مجدد زیرساخت های خود به AWS ندارد. او به گزینه دیگری احتیاج داشت. آپلمن می گوید: “GCP به خوبی در وسط قرار می گیرد.” “تنظیم آن نسبت به AWS کمی آسان تر بود.”

با این حرکت هنوز مشکلات عملکردی مطرح شده بود. به گفته اپلمان ، مهاجرت FanGraphs از یک آرایه 4xSSD RAID 10 به یک ماشین خاص به ابر ، در ابتدا به نظر افت قدرت خام بود. وی گفت: “به نظر می رسد دیگر چنین نیست.” “همه چیز عالی پیش می رود. این بار برای مهاجرت به SkySQL و GCP مشکلی نداشتیم. “

اپلمن می گوید ، FanGraphs در حال حاضر منابع اضافی SkySQL را در نظر دارد كه می تواند از آنها استفاده كند ، مانند فن آوری ذخیره سازی. وی می گوید: “ما برای بسیاری از سeriesالات خود به پاسخ در ثانیه دوم یا پایین یا دوم نیاز داریم.” “ما می خواهیم مردم بتوانند تجزیه و تحلیل داده های خیلی سریع و موقت را انجام دهند. با برخی از انواع داده های MLB ، اکنون بیش از گذشته وجود دارد – امیدواریم با بهره گیری از این ویژگی ، تجزیه و تحلیل بسیار دقیق و شخصی تری را برای کاربران خود انجام دهیم بدون اینکه مدتی صبر کنیم تا نتیجه بگیریم. اپلمن می گوید: “سایر منابع SkySQL می توانند در آینده برای اجرای پرس و جوهای چند رشته ای و منفرد برای زمان پردازش موثرتر مورد استفاده قرار گیرند.”

چند مورد در لیست خواسته های او وجود دارد که او می خواهد اکنون با پایبندی FanGraphs به ابر ، آنها را کشف کند. آپلمان می گوید که او هنوز سطح آن را با منابع GCP که می تواند مورد توجه باشد مانند یادگیری ماشین خراشیده نکرده است. در حال حاضر ، او منتظر دیدن توسعه مداوم ابزارهای گزارشگری در پایگاه داده SkySQL است. اپلمن می گوید: “دانستن دقیقاً محل گلوگاه برنامه ما برای من بسیار مهم است.” “من از ابزارهای شخص ثالث استفاده کردم تا بفهمم کدام درخواست ها را اشتباه گرفته ام. داشتن این در بخش گزارش مفید خواهد بود. “

مطالب مرتبط:

IBM Red Hat OpenShift را روی داده های ورزشی US Open کار می کند

مشاغل زیرساخت های داده بیشتری را در فضای ابری قرار می دهند

استقرار پایگاه داده در حال انتقال به ابر

Topspin و Terabytes: IBM در حال افزایش بازی ابری خود در Masters است

Joao-Pierre S. Ruth کار خود را غرق در روزنامه نگاری تجارت و فن آوری گذراند ، ابتدا در صنعت محلی در نیوجرسی ، بعداً به عنوان سردبیر Xconomy در نیویورک فعالیت های خبری خود را آغاز کرد و به انجمن راه اندازی فناوری شهر پرداخت و سپس به عنوان فریلنسر برای این موارد فعالیت کرد. سایت ها به عنوان. .. بیوگرافی کامل را ببینید

ما از نظرات شما در مورد این موضوع در کانال های رسانه های اجتماعی خود استقبال می کنیم [contact us directly] با س questionsال در مورد سایت.

مقالات بیشتر




منبع: tasiveh-news.ir

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>