Analityka predykcyjna HR

Opanowanie metryki HR

Kirsten Edwards i dr Martin Edwards

Kogan Page, 2019

W tym praktycznym podręczniku eksperci w dziedzinie analityki, Martin R. Edwards i Kirsten Edwards, zawarli wszystko, czego potrzebujesz, aby nauczyć się predykcyjnej analityki HR przy użyciu narzędzi opartych na chmurze. Na 509 stronach można znaleźć wyjaśnienia, scenariusze, ostrzeżenia o ograniczeniach analityki predykcyjnej oraz dziesiątki przypadków, które pomogą umieścić wyniki w kontekście i zinterpretować je pod kątem biznesowym. To krytyczne połączenie wyposaża specjalistów HR w narzędzia potrzebne do podejmowania lepszych decyzji ograniczonych prywatnością danych i etyką.

Artykuł przetłumaczony algorytmicznie z języka angielskiego (przepraszamy za niedoskonałości) jako materiał na nasze wyjazdy integracyjne.

Korzyści

Nadeszła era predykcyjnej analityki HR.
Zdobądź umiejętności analityczne, korzystając z prostych technik statystycznych w przyjaznym dla użytkownika oprogramowaniu.
Mając dane i środki do ich przechowywania, zacznij eksperymentować z analityką.
Test chi-kwadrat pozostaje prostym i użytecznym sposobem porównywania częstotliwości.
Następnie uruchom test t, aby porównać średnie między zmiennymi.
W przypadku wielu zmiennych niezależnych wpływających na zmienną zależną, należy użyć analizy regresji wielokrotnej.
Sprawdź ważność za pomocą analiz czynników i niezawodności.
Korzystaj z zaawansowanej analityki, aby jeszcze dokładniej wykorzystywać dane dotyczące siły roboczej.
Korelacja nie oznacza związku przyczynowego, a to, że można mierzyć, nie oznacza, że należy to robić.

Podsumowanie

Nadeszła era predykcyjnej analityki HR.
Nadeszła nowa era danych i podejmowania decyzji opartych na dowodach, a wraz z nią sprawdzone techniki przewidywania wyników decyzji i interwencji związanych z pracownikami. Analityka predykcyjna bada wzorce w danych – przyczyny liczb i wyników – oraz to, co je napędza.

„Analityka predykcyjna HR… oferuje możliwość modelowania i analizowania danych historycznych oraz badania wzorców w celu zrozumienia czynników przyczynowych”.
Dział HR może na przykład wykorzystywać modele do przewidywania, którzy nowi pracownicy będą osiągać lepsze wyniki i pozostaną dłużej, lub jakie interwencje mogą zmniejszyć niepożądaną rotację. Takie dane z kolei umożliwiają liderom podejmowanie decyzji biznesowych opartych na dowodach.

Zdobądź umiejętności analityczne, korzystając z prostych technik statystycznych w przyjaznym dla użytkownika oprogramowaniu.
Narzędzia oparte na chmurze, takie jak SPSS i R, pozwalają specjalistom HR konstruować modele do badania danych oraz znajdowania predykcyjnych wzorców i trendów. Na przykład wzrost jednej zmiennej (takiej jak uznanie) może ujawnić zmiany w innej (takiej jak zaangażowanie), co z kolei napędza produktywność lub obroty.

„Zespół analityczny musi zawsze zwracać uwagę na to, w jaki sposób ich odkrycia można przełożyć na użyteczną praktykę”.
Pozyskiwanie, uzyskiwanie i zapewnianie jakości danych dotyczących siły roboczej jest pierwszą przeszkodą dla większości zespołów HR. Należy szukać danych w zasobach ludzkich i innych platformach technologicznych oraz bazach danych, takich jak SAP i Workday. Zbierz jak najwięcej danych dotyczących pracowników i ankiet klientów z bieżących i poprzednich lat, a także pozyskaj dane dotyczące pracowników, sprzedaży i inne dane dotyczące wydajności. Zadbaj o dokładność i aktualność danych.

Licencjonowanie łatwego w użyciu pakietu oprogramowania statystycznego, takiego jak SPSS lub Minitab. SPSS pozwala na wszystkie, z wyjątkiem najbardziej zaawansowanych analiz, i wykorzystuje interfejsy użytkownika podobne do Excela, a nie wiersze poleceń, dzięki czemu jest prostszy i bardziej intuicyjny. Co więcej, można łatwo importować duże zestawy danych z Excela lub innych źródeł. Jeśli masz doświadczonych analityków, rozważ bardziej zaawansowane narzędzia, takie jak open-source R i Python, które nie wiążą się z żadnymi opłatami licencyjnymi ani kosztami.

„Gdy organizacja ma dostęp do dostępnych danych, tak naprawdę nie ma ograniczeń co do modeli predykcyjnych, które można analizować”.
W większych firmach dane dotyczące siły roboczej mogą stanowić big data: dane, które są tak ogromne (potencjalnie terabajty), o dużej objętości, szybkości i różnorodności, że wymagają znacznie większej mocy obliczeniowej do analizy. W większości przypadków konieczne będzie dodanie pojemności serwera i specjalnych baz danych, takich jak Hadoop, aby sprostać wymaganiom przetwarzania. Coraz częściej duże platformy HRIS i ERP, takie jak Oracle, SAP i Workday, wbudowują te i zaawansowane narzędzia analityczne w swoje oferty; sprawdź, czy już je masz.

Mając już dane i środki do ich przechowywania, zacznij eksperymentować z analityką.
Zastanów się najpierw, jakie modele predykcyjne mogą przynieść najbardziej przydatne i ważne wyniki. Opracuj hipotezę – opinię na temat tego, co ujawni Twój eksperyment. Na przykład, możesz przetestować pogląd, że większa różnorodność w zespołach poprawia wyniki zaangażowania zespołu. Wyniki mogą wykazać prawdopodobieństwo (wartość P) na poziomie 0,08 (lub 92%), co oznacza, że jakikolwiek związek między różnorodnością zespołu a zaangażowaniem w tym przypadku nie spełnia testu istotności (który wymaga wartości P równej 0,05 lub mniejszej).

„Zawsze chcemy, aby nasze testy statystyczne wskazywały poziom istotności 0,05, abyśmy mogli powiedzieć, że mamy „statystycznie istotne” wyniki”.
W analizach należy określić zmienne zależne i niezależne, aby móc wybrać odpowiednie metody statystyczne. Jeśli na przykład chcesz sprawdzić, czy uczestnictwo w szkoleniu dla pracowników zwiększa zadowolenie klientów, frekwencja służy jako zmienna niezależna. Wpływa ona na zmienną zależną (zadowolenie klienta), ponieważ zmiany w zadowoleniu klienta zależą od uczestnictwa w kursie. Stawiasz hipotezę, że osoby uczestniczące w kursie nauczą się rzeczy, które poprawią ich interakcje z klientami, powodując wzrost zadowolenia klientów. Twój model predykcyjny testuje to, uzyskując wartość P, która, jeśli jest równa lub mniejsza niż 0,05, wspiera wniosek, że prawdopodobnie istnieje związek między dwiema zmiennymi.

„Nawet jeśli znajdziemy znaczący związek lub powiązanie między dwiema zmiennymi… niekoniecznie oznacza to, że zmiany w zmiennej niezależnej „powodują” zmiany w zmiennej zależnej”.
Należy uważać, aby nie dojść do wniosku, że uczestnictwo w kursie powoduje większą satysfakcję klienta. Tylko dlatego, że wskaźniki raka skóry rosną wraz ze sprzedażą lodów, co skutkuje wartościami P mniejszymi niż 0,05, na przykład, nie oznacza, że lody powodują raka skóry. Twoje wstępne analizy mają tendencję do ujawniania korelacji, a nie związku przyczynowego. Aby dobrze prognozować, należy przeprowadzić dalsze badania.

Test chi-kwadrat pozostaje prostym i użytecznym sposobem porównywania częstotliwości.
Jeśli masz zmienne nieliczbowe, między którymi chcesz przetestować relacje, rozważ użycie testu chi-kwadrat. Na przykład, chcesz porównać wskaźniki awansów między mężczyznami i kobietami oraz ich częstość występowania w różnych kategoriach stanowisk. Najpierw wprowadź liczbę mężczyzn i kobiet zatrudnionych na każdym poziomie stanowiska do wykresu częstotliwości: na przykład poziomy od 1 (pracownik biurowy) do 8 (dyrektor). Można od razu zauważyć, że pomimo mniej więcej równej liczby mężczyzn i kobiet w firmie, kobiety częściej należą do niższych kategorii, a mężczyźni do wyższych. Możesz stworzyć użyteczny raport opisowy na temat tego spostrzeżenia, tworząc pionowy wykres słupkowy i umieszczając go na slajdzie.

„Test chi-kwadrat porównuje częstotliwości, które faktycznie zaobserwowano w określonych warunkach, z częstotliwościami, których można by się spodziewać, gdyby nie było absolutnie żadnego związku między dwiema zmiennymi”.
Aby rozpocząć badanie przyczyn i powodów tego pozornego braku równowagi, zacznij od testu chi-kwadrat, aby określić, czy różnice w częstotliwościach są znaczące, czy też mogą wystąpić przez przypadek. W tym przypadku, ponieważ mężczyźni i kobiety stanowią około połowy siły roboczej, można oczekiwać, że będą oni w mniej więcej równej liczbie na każdym z ośmiu poziomów. Obliczenie chi-kwadrat porównuje oczekiwane i rzeczywiste liczby na ośmiu poziomach. Załóżmy, że ujawnia ogólną wartość P wynoszącą 0,001 – mniej niż 1 na 1000 szans, że te częstotliwości mogły wystąpić przypadkowo. Wynik ten zasługuje na dalsze zbadanie.

Następnie przeprowadź test t, aby porównać średnie między zmiennymi.
Teraz, w ramach płci, możesz chcieć zbadać dodatkowe czynniki, takie jak rasa osób i ich rozkład na ośmiu poziomach. Analiza t-testem może ujawnić niższe lub wyższe niż oczekiwane średnie w każdej z kategorii. Na przykład, choć na wyższych poziomach brakuje ogólnie reprezentatywnej liczby kobiet, mniejsze rozbieżności występują wśród białych kobiet niż wśród czarnoskórych i rdzennych Amerykanek. Mężczyźni wszystkich ras dominują na poziomie 5, starszych specjalistów ds. technicznych/inżynieryjnych. Teraz masz więcej wskazówek, że coś jest nie tak i powodów, aby kopać jeszcze głębiej, aby odkryć dlaczego.

W przypadku, gdy istnieje wiele zmiennych niezależnych wpływających na zmienną zależną, należy użyć analizy regresji wielokrotnej.
W HR zazwyczaj trzeba przetestować kilka zmiennych niezależnych w stosunku do zmiennej zależnej, aby wiedzieć, które z nich okażą się najsilniejsze i najbardziej znaczące. Przykładowo, zastanawiasz się, w jaki sposób płeć i różnorodność wśród poziomów wpływają na zaangażowanie pracowników. Tworzysz model, który uwzględnia płeć, rasę i inne typowe czynniki, takie jak oceny przełożonych, rodzaje pracy na poszczególnych poziomach i lokalizację pracy. W tym przypadku, ponieważ zmienna zależna (zaangażowanie) nie jest binarna (tak/nie) i masz wiele zmiennych niezależnych, przeprowadzasz wielokrotną regresję liniową (w przeciwieństwie do analizy regresji logistycznej lub prostej regresji liniowej).

„Analityka predykcyjna nie jest nauką ścisłą, a wgląd, jaki można uzyskać, będzie często ograniczony do tego, jak dobre są dostępne dane”.
Po pierwsze, analiza informuje o tym, jak duży ogólny wpływ na zaangażowanie mają niezależne zmienne (łącznie). Jeśli jest on bardzo niski (może 5% lub mniej), możesz chcieć skupić swoją energię gdzie indziej. Jeśli zmienne mają znaczący wpływ, zbadaj dalej, aby zobaczyć, które (i jakie kombinacje) za to odpowiadają. Użyj pakietu statystycznego, aby przeprowadzić test ANOVA (analiza wariancji). Ujawni to wartość P (istotność statystyczną) każdej ze zmiennych niezależnych dla zmiennej zależnej (zaangażowania). Na tej podstawie można przewidzieć, że programy zwiększające jakość nadzoru i różnorodność płci będą miały największy, pozytywny wpływ na wyniki zaangażowania – spostrzeżenie, które powinno zainteresować liderów.

„Większość organizacji będzie przeglądać raporty rotacji w arkuszu kalkulacyjnym pokazującym odsetek osób… które odeszły w danym okresie, ale bardzo niewiele analiz zostanie przeprowadzonych w celu zbadania, dlaczego tak się dzieje”.
Biorąc pod uwagę wysokie koszty zastępowania pracowników, liderzy docenią wgląd w to, co może zmniejszyć rotację. Również w tym przypadku tabele częstotliwości i testy chi-kwadrat mogą określić, czy problem osiąga poziom istotności w przypadku określonej roli, regionu itp. Ponieważ dana osoba albo zostaje, albo odchodzi, rotacja ma charakter binarny. W związku z tym należy użyć wielokrotnej regresji logistycznej, aby sprawdzić wpływ różnych zmiennych niezależnych na indywidualną rotację. Na przykład w modelu można uwzględnić płeć, wiek, staż pracy i ostatnie oceny wyników. Możesz dowiedzieć się, że niedawna niska ocena wydajności wśród kobiet i osób poniżej 30 roku życia obu płci przewiduje rotację na znaczącym poziomie.

Prognozy dotyczące wyników mogą okazać się najtrudniejsze. Na przykład, jakiej miary wydajności użyjesz? Jeśli wierzysz w swoje oceny wydajności, możesz użyć historycznych i bieżących danych z tego źródła. W przeciwnym razie możesz użyć ocen satysfakcji klienta lub innego proxy dla wydajności.

„Można uznać zdolność analityki HR do przewidywania przyszłych wyników za świętego Graala analityki HR”.
Aby przewidzieć lojalność klientów i prawdopodobieństwo zwiększenia wydatków (dwie zależne zmienne wydajności), należy użyć wielokrotnej regresji liniowej. Postawiono hipotezę, że lojalność zależy od tego, czy sprzedawcy znają potrzeby klientów (F1); od pewności siebie sprzedawcy (F2); od tego, czy sprzedawca udziela rekomendacji (F3); od tego, czy sprzedawca posiada wiedzę (F4); oraz od płci sprzedawcy (F5). Ankietujesz klientów, pytając ich o płeć ich sprzedawcy i oceniając tę osobę (1-5) w odniesieniu do czterech czynników. Poproś również klienta o ocenę prawdopodobieństwa dokonania większych zakupów i stopnia, w jakim mogą dokonać większych zakupów w nadchodzącym roku.

Zbuduj model predykcyjny z lojalnością klienta (a) jako pierwszą zmienną zależną: a = F1+F2+F3+F4+F5. Można zauważyć, że łącznie te pięć czynników odpowiada za 32,6% zamiaru pozostania klienta w firmie. Następnie należy przeprowadzić analizę ANOVA. Może to potwierdzić znaczące wartości P dla „zrozumienia przez sprzedawcę” i „posiadania przez sprzedawcę rekomendacji”. Przeprowadź te same analizy dotyczące wydatków klientów, a znajdziesz tę samą korelację.

Teraz możesz przewidzieć działania, które Twoja firma może podjąć, aby poprawić lojalność klientów i zwiększyć ich wydatki. W tym przypadku tylko dwa czynniki okazały się istotnymi czynnikami wpływającymi na lojalność i wydatki klientów. Dalsze modelowanie finansowe może przewidzieć prawdopodobne zwroty z inwestycji dokonanych w tych obszarach. Pozostałe czynniki, choć nieistotne, dają dobre informacje na temat tego, gdzie nie należy koncentrować wysiłków.

Sprawdź poprawność za pomocą analiz czynników i niezawodności.
W HR, wiele miar nie ma konkretnych, obiektywnych, wymiernych liczb lub jednostek – jak w przypadku pomiaru zaangażowania pracowników. Zamiast tego polegasz na wynikach ankiet, wywiadów i grup fokusowych. Podczas konstruowania ankiet w celu przetestowania zmiennych i hipotez, należy zadbać o ich ważność.

Użyj analizy czynnikowej, aby określić, które pytania z ankiety pomagają zmierzyć zmienne, które zamierzasz zmierzyć. Dodaj miarę wiarygodności, aby określić zakres, w jakim respondenci konsekwentnie odpowiadają na podobne pytania w ankietach. Te dodatkowe kontrole zapewniają „ważność kryterialną”. Większa wiarygodność daje większe zaufanie do gromadzonych danych i późniejszych zaleceń.

Korzystaj z zaawansowanej analityki, aby jeszcze dokładniej wykorzystywać dane o pracownikach.
Wraz ze wzrostem komfortu i umiejętności w zakresie analityki predykcyjnej, warto rozważyć wykorzystanie pakietu statystycznego i danych w celu zbadania nieliniowych wyników. Na przykład wywieranie presji na pracowników, by pracowali ciężej i produkowali więcej, może przez pewien czas przynosić pożądany efekt – liniowe powiązanie. Jednak gdy ludzie się wypalają, wydajność spada. Możesz łatwo przeoczyć tę „krzywoliniową zależność” i inne podobne, chyba że zastanowisz się nad potencjałem takiej zależności i przeprowadzisz analizę regresji z estymacją krzywej w swoim oprogramowaniu.

Wśród wielu innych bardziej zaawansowanych analiz predykcyjnych, uczenie maszynowe (ML) może przyciągać najwięcej uwagi. Przykłady predykcyjnego uczenia maszynowego można znaleźć we wszystkim, od rekomendacji w serwisie Netflix po zapobieganie oszustwom związanym z kartami kredytowymi. ML wykorzystuje wyszkolone algorytmy, które wyszukują wzorce w danych, ale w wielu przypadkach działają w sposób ciągły i szybki w oparciu o duże dane w czasie rzeczywistym.

Korelacja nie oznacza związku przyczynowego, a to, że możesz mierzyć, nie oznacza, że powinieneś to robić.
Myśl jak naukowiec. Nie szukaj konkretnych miar ani nie wybieraj danych, które mogą pomóc w udowodnieniu z góry określonej tezy. Zaplanuj potrzebne dane i rozważ najlepsze metody statystyczne do znalezienia prawdy. Używaj wielu obiektywnych miar i odpowiedniego próbkowania danych. Raportuj tylko to, co wynika z analizy i skłaniaj się ku konserwatywnym wnioskom.

„Każda próba przewidzenia lub modelowania dowolnego wskaźnika lub aspektu wydajności organizacyjnej powinna obejmować szereg różnych wskaźników lub wskaźników w celu oceny pełnego zakresu określonej wydajności, sukcesu lub funkcji lub zachowania pracowników”.
Chroń wrażliwe dane, zachowaj przejrzystość w sposobie ich wykorzystywania i doradzaj liderom w zakresie etycznego i właściwego wykorzystania danych i spostrzeżeń. Na przykład, analizy mogą przewidywać, że kobiety osiągają średnio lepsze wyniki niż mężczyźni na stanowiskach kierowniczych. Jednak dyskryminacja przy awansach jest nieetyczna i może wpędzić firmę w kłopoty prawne. Podobnie, wykorzystywanie danych historycznych do trenowania algorytmów ML może wpływać na zalecenia maszyny dotyczące zatrudniania. Poznaj i przestrzegaj różnych krajowych i międzynarodowych zasad i przepisów dotyczących wykorzystania danych. Zawsze pamiętaj, że dane dotyczące zasobów ludzkich pochodzą od ludzi.

O Autorach

Martin R. Edwards uczy i konsultuje się w zakresie analityki HR na uniwersytetach i w firmach klienckich na całym świecie. Kirsten Edwards kieruje analityką w Empathix i prowadzi wykłady na ten temat w szkołach biznesu Kent i King’s College

Rate this post

Rafał Szczepanik

Menu strony