FMCG

Usprawnienie operacji związanych z danymi za pomocą bazy danych Lakehouse opartej na metadanych na platformie Azure

Client

Globalna firma FMCG/CPG

Date

Services

Inżynieria danych

Technologies

Databricks, Python, Azure, Spark, CI/CD (Azure DevOps/ GitHub)

Challenge

Firma z listy Fortune 500 FMCG zmagała się ze swoim istniejącym rozwiązaniem Azure Databricks data lake, które było nękane złożonością, zduplikowanymi zestawami danych i brakiem struktury. Wymagały one usprawnionego rozwiązania w celu uproszczenia operacji z danymi, poprawy jakości danych i poprawy możliwości wykrywania danych, a wszystko to przy jednoczesnej optymalizacji kosztów.

Our approach

Nasz zespół uruchomił transformacyjny projekt migracji jeziora danych Azure Databricks klienta do jeziora danych opartego na metadanych przy użyciu architektury medalionu. Wykorzystując Databricks, Python, Azure i Spark, wdrożyliśmy skalowalne i zorganizowane rozwiązanie, które wymusiło strukturę medalionu i poprawiło jakość danych bez zakłócania przepływów pracy użytkowników.

Kluczowe składniki rozwiązania obejmowały:

  • Struktura oparta na metadanych do automatyzacji pociągu danych, obejmująca takie funkcje, jak automatyczne wyodrębnianie danych, archiwizacja i obsługa obciążenia przyrostowego.
  • Bezszwowe egzekwowanie struktury medalionu, które zachowało przyjazną dla użytkownika elastyczność.
  • Integracja wielkich oczekiwań w zakresie zautomatyzowanych kontroli jakości danych i walidacji.

The outcome

Migracja do bazy danych opartej na metadanych przyniosła znaczne ulepszenia w zakresie wykrywalności i użyteczności danych. Architektura medalionu zapewniła przejrzystą strukturę, umożliwiając programistom obywatelskim bezpośrednie angażowanie się w zbiory danych, sprzyjając samoobsługowej analityce i innowacjom.

Dodatkowo funkcje automatyzacji, w tym wyodrębnianie danych, archiwizacja i obciążenia przyrostowe, znacznie obniżyły koszty rurociągów i zwiększyły wydajność operacyjną. Integracja Great Expectations zapewniła integralność i niezawodność danych, spełniając standardy wysokiej jakości.

Business Impact

Projekt zrewolucjonizował operacje danych klienta, usprawniając procesy i usprawniając zarządzanie danymi. To skalowalne i wydajne rozwiązanie umożliwiło klientowi wykorzystanie pełnego potencjału zasobów danych, zwiększając samoobsługowe analizy, oszczędności kosztów operacyjnych i szybsze podejmowanie decyzji w konkurencyjnej branży FMCG.

"Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat."

Name Surname
Position, Company name

Porozmawiajmy i pracujmy razem

Skontaktujemy się z Tobą w ciągu 4 godzin w dni robocze (od poniedziałku do piątku, od 9:00 do 17:00 CET).

Data engineering for cloud-based data processing and storage.
Dominik Radwański
Partner ds. Usług
Administratorem Państwa danych osobowych jest DS STREAM sp. z o.o. z siedzibą w Warszawie (03-840), przy ul. Grochowska 306/308. Twoje dane osobowe będą przetwarzane w celu udzielenia odpowiedzi na pytanie i archiwizacji formularza. Więcej informacji na temat przetwarzania Twoich danych osobowych można znaleźć w Polityka prywatności.
Dziękuję! Twoje zgłoszenie zostało odebrane!
Ups! Coś poszło nie tak podczas przesyłania formularza.