డేటాతో ఎలా ప్రారంభించాలి

క్రెడిట్: https://www.flickr.com/photos/gleonhard/31254136671/in/photostream/

మనమందరం ధ్వని కాటు విన్నాము.

"ప్రపంచంలోని అత్యంత విలువైన వనరు ఇకపై చమురు కాదు, డేటా" - ది ఎకనామిస్ట్

బహుశా. డేటా చమురు లాంటిది అయితే చాలా సంస్థలలో డేటా స్థితి దీన్ని పోలి ఉంటుంది:

డీప్వాటర్ హారిజోన్ ఆయిల్ స్పిల్

డేటా మహాసముద్రానికి లెక్కలేనన్ని డేటా ప్రవాహాలు కోల్పోతున్నాయి. ఏదైనా డేటా శాస్త్రవేత్తను అడగండి మరియు డేటా సైన్స్ గురించి కష్టతరమైన విషయం సరైన డేటాను సంగ్రహించడం అని వారు మీకు చెప్తారు. కాబట్టి మనం ఎలా ప్రారంభించాలి?

1. సరైన ప్రశ్నలు అడగండి

దాని కోసమే డేటాను సంగ్రహించడం వృధా మరియు సమయం తీసుకుంటుంది. మేము మా కొలమానాలను గుర్తించాలి, ఇది వ్యాపారం యొక్క లక్ష్యాలను బట్టి ఉండాలి. అత్యధికంగా అమ్ముడయ్యే ఉత్పత్తులు ఏమిటి? బహుళ-దశల ప్రక్రియను వినియోగదారులు ఎక్కడ వదిలివేస్తున్నారు? మాకు ఎంత మంది క్రియాశీల వినియోగదారులు ఉన్నారు? చాలా సంస్థలు తమ వాటాదారులకు కొలవగలిగే విషయాల ఆధారంగా కొలమానాలను ప్రదర్శిస్తాయి (ఉదా. రాబడి) వారి కంపెనీ దిశకు ఏది ఉత్తమంగా సరిపోతుందో కాదు.

మేము కొలవడానికి ఏమి ప్రయత్నిస్తున్నామో తెలుసుకున్న తర్వాత, డేటా కోసం ఎక్కడ వెతకాలి అని మేము నిర్ణయించగలము మరియు సంబంధిత డేటాను సంగ్రహించడం ప్రారంభించడానికి దశలను ప్లాన్ చేయవచ్చు.

2. డేటా ఆధారిత సంస్కృతిని అందించండి

ఒక సంస్థ ఒక నిర్దిష్ట పరిమాణానికి పెరిగిన తర్వాత వారు ఇకపై “గట్ ఫీలింగ్” పై ఆధారపడలేరు. నిర్ణయాలు డేటా ఆధారంగా ఉండాలి మరియు ఈ డేటా అన్ని స్థాయిలకు అందుబాటులో ఉండాలి.

ఉద్యోగులు డేటా మరియు కొలమానాలను యాక్సెస్ చేయగలరా లేదా వారు భద్రత మరియు రెడ్ టేప్ యొక్క పలు పొరల వెనుక ఉన్నారా? డేటాసెట్లలో డేటా అన్వేషణను నిర్వహించడానికి ఉద్యోగులకు అధికారం ఇవ్వాలి (ఇది గోప్యతను గౌరవించటానికి అనామకంగా మరియు భద్రంగా ఉండాలి). అంతర్గత స్వీయ సేవా విశ్లేషణ వేదిక దీనికి అనువైనది. ఈ పని బహిరంగంగా మరియు పారదర్శకంగా ఉండాలి. పనిని డాష్‌బోర్డ్‌లో ఉంచడం మరియు సంస్థను విస్తృతంగా భాగస్వామ్యం చేయడం అత్యవసరం.

ఈ రకమైన పనికి సంస్థలు మద్దతు, ప్రోత్సాహం మరియు వనరులను అందించాలి. అంటే సమయం మరియు డబ్బు, అయితే డేటా నడిచే సంస్కృతి మరింత సమాచారం ఇచ్చే నిర్ణయం తీసుకోవడాన్ని ప్రోత్సహిస్తుంది.

3. డేటా ఇంజనీర్లను నియమించుకోండి

డేటా ఇంజనీర్లను కాకుండా డేటా సైంటిస్టులను నియమించడం సంస్థల సాధారణ కొరత. డేటా శాస్త్రవేత్తలు ఖచ్చితంగా విమర్శనాత్మకం, వారు డేటాలో నమూనాలను కనుగొనగలరు, ఫలితాలను అంచనా వేయగలరు మరియు తమను తాము మెరుగుపరచడానికి నేర్చుకోగల నమూనాలను వ్రాయగలరు. ఇదంతా నాణ్యమైన డేటాపై ఆధారపడి ఉంటుంది. పెద్ద డేటా మౌలిక సదుపాయాలు, ఇటిఎల్ మరియు ప్రోగ్రామింగ్ ఆటోమేటెడ్ వర్క్‌ఫ్లోల ద్వారా మాత్రమే తిరిగి పొందగలిగే డేటా. ఇది సాధారణంగా డేటా ఇంజనీర్ పాత్ర. దీనికి అర్హత ఉన్న వ్యక్తులకు పనిని ఇవ్వండి మరియు మరీ ముఖ్యంగా దీన్ని చేయడం ఆనందించండి.

4. చిన్న మరియు చౌకగా ప్రారంభించండి

పెద్ద డేటా హైప్ రైలులో దూకడం, డేటా సైన్స్ బృందాన్ని సృష్టించడం, ఎంటర్ప్రైజ్ అనలిటిక్స్ సాఫ్ట్‌వేర్‌ను కొనుగోలు చేయడం మరియు దాని కోసం చూపించడానికి చాలా తక్కువ డబ్బుతో పెద్ద మొత్తంలో ఖర్చు చేయడం చాలా ఉత్సాహం కలిగిస్తుంది. పెద్ద పెట్టుబడి పెట్టడానికి ముందు చాలా చేయవచ్చు. ఏదైనా సంస్థ ఉపయోగించగల కొన్ని సాధనాలు ఇక్కడ ఉన్నాయి:

  • మిక్స్ప్యానెల్ లేదా యాంప్లిట్యూడ్ వంటి జావాస్క్రిప్ట్ అనలిటిక్స్ లిబ్స్. ఇది కొంత మొత్తంలో నెలవారీ వినియోగదారులకు ఉచితం.
  • ఆటోమేటెడ్ వర్క్ఫ్లో నిర్వహణ కోసం వాయు ప్రవాహం. Airbnb చే సృష్టించబడింది మరియు అపాచీ సాఫ్ట్‌వేర్ ఫౌండేషన్‌లో పొదిగినది, ఇది ఓపెన్ సోర్స్ మరియు డేటా ఇంజనీర్లకు వాస్తవ ప్రమాణం.
  • సూపర్‌సెట్‌తో డాష్‌బోర్డ్‌లు, పటాలు మరియు డేటా అన్వేషణ (అపాచీ చేత కూడా). మెటాబేస్ కూడా మంచి ప్రత్యామ్నాయం మరియు రెండూ ఓపెన్ సోర్స్.
  • డేటాబ్రిక్స్ కమ్యూనిటీ ఎడిషన్ మరియు కాగ్లే. రెండింటినీ క్లౌడ్‌లోని డేటా సైన్స్ ప్రక్రియల కోసం మరియు ఉచితంగా ఉపయోగించవచ్చు.
  • అమెజాన్ వెబ్ సర్వీసెస్ ఎస్ 3. ఉచితం కాదు కానీ ఇక్కడ చేర్చబడింది ఎందుకంటే ఈ రోజు సాంకేతిక పరిజ్ఞానం అభివృద్ధి చెందుతున్నందున డేటా గిడ్డంగిని కలిగి ఉండటం ఎల్లప్పుడూ అవసరం లేదు. నిల్వ చౌకగా ఉంటుంది మరియు డేటాబ్రిక్స్, మొంగోడిబి డేటా లేక్, ఎడబ్ల్యుఎస్ ఎథీనా వంటి సేవలు అంటే మీరు మీ డేటా లేక్ నుండి నేరుగా చదవగలరు.

ఈ ఆలోచనలు సంస్థకు సరైన డేటాను సంగ్రహించడం మరియు దాని విలువను గ్రహించడం ప్రారంభించడానికి మంచి పునాదిని అందిస్తుంది.