Πριν από ένα μήνα και κάτι, έγραψα ένα post που ήταν λίγο διαφήμιση του Google Analytics, λίγο ανάλυση των στατιστικών του Σπιτάκι, και λίγο θεωρείες για το τι ακριβώς μας λένε τα τυπικά blog-ο-στατιστικά. Πάμε για το sequel.
Στο πρώτο μου post είχα αναφέρει πως τα περισσότερα πακέτα στατιστικών δεν είναι προφανές ακριβώς τι μετράνε — κάποια παίζει να μετράνε τις καθημερινές επισκέψεις σε μια σελίδα. Αυτό μπορεί να είναι παραπλανητικό για διάφορους λόγους. Προφανώς είναι καλύτερο* από το να μετράνε απλώς τα pagehits, γιατί ως ερασιτέχνες, τους περισσότερους μας ενδιαφέρει πόσοι μας διαβάζουνε. Οπότε αυτό που μας ενδιαφέρει δεν είναι ούτε τα pageviews, ούτε οι επισκέψεις, μα οι επισκέπτες. (Η διαφορά επισκέπτη και επίσκεψης; Αν φύγετε από τη σελίδα, και μετά από κάποια ώρα γυρίσετε, μετράτε για δύο επισκέψεις.) Ακόμα και να μετράει επισκέπτες, δυστυχώς, τα πράγματα δεν είναι τέλεια. Μιλάμε για Ελληνικά blog, και οι περισσότεροι Έλληνες χρήστες έχουν dialup ή dynamic-IP DSL. Για τις DSL δεν είναι τόσο πρόβλημα, γιατί με την εξαίρεση κάποιων λίγων πιστεύω, ο κόσμος λογικά μπαίνει στο internet το πρωί, και βγαίνει το βράδυ (αν βγαίνει καθόλου), οπότε το IP του μένει το ίδιο. Για τις dialup όμως, που κάποιος μπορεί να μπει δέκα φορές την ημέρα, και να έχει συνεπώς δέκα διαφορετικά IP, είναι σοβαρό πρόβλημα. Ειδικά αν υπάρχουν τέτοιοι τακτικοί επισκέπτες — αν πέντε κολλητοί μπαίνουν κάνουν καμιά δεκαριά επισκέψεις ο καθένας ημερησίως, πιθανώς από διαφορετικό IP κάθε φορά, τότε αμέσως-αμέσως έχεις 50 επισκέπτες αντί για το πραγματικό νούμερο 5.
Στατιστικά — τι μας λένε;
Ως ένα παράδειγμα του ότι τέτοια πράγματα μπορεί όντως να κάνουν διαφορά, για να δούμε τα στατιστικά του Σπιτάκι για το Φεβρουάριο 2006. Δείτε το πρώτο γράφημα, τα κεντρικά στατιστικά του blog.

(Είναι λίγο μικρά, το ξέρω, αλλά τι να κάνουμε.)
Ωραία ε; Λοιπόν, για δείτε τι συμβαίνει όταν πούμε στο Google Analytics να φιλτράρει τα αποτελέσματα, έτσι ώστε να αγνοεί έξι IP addresses — το σπίτι μου, το γραφείο μου, το σπίτι και το γραφείο του Γιάννη, και τα γραφείο των morpheous και Mάρκου. (Τα IP των υπολοίπων resident είναι dynamic.)

Ενδιαφέρον δεν είναι; Βγάζοντας έξι IP, πέφτουν οι επισκέψεις κατά 20 έως 40 την ημέρα. Φυσικά, εμείς έχουμε την τάση να μπαίνουμε συχνά στο site, για να βλέπουμε τα τυχόν άρθρα, σχόλια, κτλ. Σε έναν τέλειο κόσμο, θα εμφανιζόντουσαν ως 4 επισκέπτες, γιατί δε θα θέλαμε να μετράω εγώ και ο Γιάννης ως δύο διαφορετικά άτομα αν μπαίνουμε από το σπίτι ή το γραφείο. Αν τα IP σε αυτές τις τοποθεσίες ήταν και δυναμικά από πάνω, αντί για τέσσερις, θα μπορούσαμε να μετράμε για 20 έως 40 επισκέπτες, όχι απλά επισκέψεις.
Οπότε όλα τα στατιστικά που θα δείτε πιο κάτω είναι φιλτραρισμένα — οι έξι τοποθεσίες που ανέφερα δε μετράνε.
Ας αρχίσουμε με μερικά βαρετά πράγματα — τοποθεσία προέλευσης, browser, screen resolution, λειτουργικό, κτλ.




Ωραία. Ενδιαφέροντα; Ε…
Σ’ ένα μόνο πράγμα θέλω να σας επιστήσω την προσοχή, και αυτό έχει να κάνει με τους browsers. Την τελευταία φορά που κοίταξα τα στατιστικά, δηλαδή αυτά της περιόδου Ιανουαρίου, είχαμε 49% Firefox και 36% ΙΕ. Στο Φλεβάρη έχουμε 47% ΙΕ και 40% Firefox. Γνωστό Ελληνικό blog, λιγότερο tech-oriented από το Σπιτάκι, έχει 72% ΙΕ και 25% Firefox. Η αλλαγή στα ποσοστά μου φαίνεται περίεργη, αλλά γενικά το Φλεβάρη φαίνεται να είχαμε περισσότερο κόσμο. Ήταν και όλα τα post περί σκίτσων Μωάμεθ, που μπορεί να φέρανε πιο γενικού ενδιαφέροντος κόσμο.
Τέσπα, πάμε σε κάτι γενικότερου ενδιαφέροντος. Όπως είχα αναφέρει την προηγούμενη φορά, καλό να σε διαβάζει πολύς κόσμος, αλλά πολλές επισκέψεις δε σημαίνει πως όντως σε διαβάζουν. Ας πούμε κάποιος θα μπορούσε να έχει αρκετούς επισκέπτες κάθε μέρα, αλλά τι να τους κάνει αν έρχονται, βλέπουν γενικά τι παίζει, φεύγουν, και δεν ξαναπατάνε ποτέ; Μπορεί να μην τον διαβάζει και κανείς! (Φυσικά, αν κάποιο blog έχει πολλά hits σε καθημερινή βάση, τότε μάλλον δεν είναι τυχαία.)
Πριν μπούμε στα πιο ενδιαφέροντα στατιστικά, ας δούμε τη διαφορά μεταξύ επισκεπτών και επισκέψεων.


Είναι εμφανές το ότι το πως μετράς τους επισκέπτες (αν είναι όντως επισκέπτες ή επισκέψεις) έχει μεγάλη σημασία.
Το Google Analytics μπορεί να σας προσφέρει διάφορα στατιστικά για να καταλάβετε τι συμβαίνει. Πιθανώς το ίδιο και με άλλα πακέτα. Ας πούμε υπάρχει το visit length, δηλαδή πόσα δευτερόλεπτα κάτσανε στη σελίδα σας.

Όπως βλέπετε, οι περισσότεροι επισκέπτες του Σπιτάκι κάθονται λιγότερο από δέκα δευτερόλεπτα. Εκτός αν δεν είναι η πρώτη σου επίσκεψη της ημέρας, και απλώς κοιτάς αν βγήκε τίποτα καινούργιο, τότε προφανώς δε μετράς ως ‘αναγνώστης.’
Καλύτερο ίσως metric είναι το loyalty.

Οπότε στο Σπιτάκι έχουμε τακτικούς αναγνώστες, αλλά τα περισσότερο hit που έχουμε είναι ψιλοάχρηστα, υπό την έννοια του ότι σχεδόν τρεις χιλιάδες από αυτά γίναν από άτομα που δε ξαναγυρίσαν ποτέ στο blog. Άτομα που πιθανώς διαβάσαν κάτι, αλλά δεν ενδιαφερθήκαν αρκετά ώστε να ξαναδιαβάσουν.
Άλλο κλασσικό νούμερο που ενδιαφέρει είναι το visit depth. Ειδικά αν είστε προσεκτικοί να έχετε οργανώσει το blog σας, έτσι ώστε όλα σας τα post ουσιαστικά να έχουν στην κεντρική σελίδα ένα μικρό blurb, και η ουσία να είναι στη σελίδα του ίδιου του post, το visit depth μπορεί να σας πει πόσα post διάβασε ο κάθε επισκέπτης.

Εμείς τα περισσότερο post τα έχουμε στην κεντρική σελίδα, το οποίο είναι μια καλή δικαιολογία για το pathetic visit depth που φαίνεται να έχουμε!
; )
Τέλος, το Analytics είναι γενικά πολύ ωραίο, οπότε μπορείς να του ζητήσεις να σου δείξει τα visits καθημερινά μόνο για τους καινούργιους, και μόνο για τους παλιούς.


Κοιτώντας τις δύο σειρές με το μάτι, εμένα τουλάχιστον μου φαίνονται πολύ ύποπτα correlated μεταξύ τους. Τα peaks είναι τα ίδιο, το ίδιο και για τα troughs, και γενικά τα δύο σχήματα μοιάζουν υπερβολικά. Αυτό μπορεί να σημαίνει (off the top of my head) δύο πράγματα. Είτε ότι παίρνουμε πάρα πολύ κόσμο, και παλιούς και καινούργιους, από το monitor, οπότε παίζει αν θα πιάσει τη προσοχή του κόσμου κάποιο post εκεί, είτε αυτό που έλεγα νωρίτερα για τα dynamic IP, ότι υπάρχουν αναγνώστες που μπαίνουν από IP τα οποία δεν είχαν χρησιμοποιήσει παλιότερα.
Οπότε για να κοιτάξουμε τους referrer — δηλαδή ποιοί στέλνουν κόσμο στο blog, και πόσο.

Το monitor ευθήνεται για χοντρικά 20% της κίνησης του blog, και το google search για περίπου 33%. Για να κοιτάξουμε το monitor πιο προσεκτικά.

Ενδιαφέρον είναι και το εξής γράφημα, που δείχνει πάλι τα ίδια πράγματα, μα από τις αρχές Δεκεμβρίου μέχρι σήμερα.

Πρόσφατα υπάρχουν πολύ περισσότερα μεγάλα spikes. Φαντάζομαι πως αρχίζουν την περίοδο που άρχισε το monitor να χρησιμοποιεί linkblog, και να μεγαλώνει το μέγεθος των γραμμάτων των blog entries του καθενός ανάλογα με τα linkblog. Γενικά αυτό το σύστημα νομίζω πως θέλει δουλειά ακόμη — θα προτιμούσα κάτι ίσως που να δουλεύει μόνο για το κάθε post ξεχωριστά, και όχι για ολόκληρο το blog. Επίσης, θα προτιμούσα ίσως κάτι που να μετρούσε πόσοι ακολουθήσαν το link για το post. Τέλος, πιστεύω πως χρειάζεται λίγο αλλαγή το “δημοφιλή” section του monitor. Πιστεύω πως θα ήταν πολύ πιο χρήσιμο αν περιείχε μόνο post από τα τελευταία δύο εικοσιτετράωρα. Τέσπα, ίσως γράψω αναλυτικότερα για monitor-ιδέες άλλη φορά.
Πάντως, το Φεβρουάριο, το λιγότερο 14 referral την ημέρα, και το μεγαλύτερο 85.
Ας κοιτάξουμε και το Google. Τι ψάχνουν πια και μας βρίσκουν τόσοι πολλοί;

Παρά πέντε, παρά πέντε, παρά πέντε… Και πολύ πιο πολύ απ’ ότι υποδηλώνει αυτή η εικόνα — δείτε παρακάτω.

Συγκλονιστικό; Πρέπει να κάτσω να δω και το επεισόδιο της Δευτέρας.
Το θέμα με το παρά πέντε είναι το εξής. Αν έρθει ο άλλος στο Σπιτάκι για να δει κάτι για το παρά πέντε, θα κάτσει; Μάλλον όχι. Γι’ αυτό έχουμε το bouncerate.

To bouncerate μας λέει τι ποσοστό από αυτούς που μπήκαν στο site από μια συγκεκριμένη σελίδα, έφυγε και από την ίδια σελίδα. Με άλλα λόγια, ποιός ήρθε, διάβασε μόνο ένα post (στην καλύτερη), και δεν ενδιαφέρθηκε για τα υπόλοιπα.
*Να σημειωθεί όμως πως, για άλλες χρήσεις, σα διαφημίσεις, το σημαντικό είναι τα pageviews, όχι ο αριθμός επισκεπτών. Τουλάχιστον, τα σοβαρά, μεγάλα Αμερικάνικα blog, με βάση τα pageviews χρεώνουν τους διαφημιστές τους.
Η αξία των link
Στις 15 Μαρτίου έγινε κάτι το ενδιαφέρον — ο Πιτσιρίκος έκανε link το άρθρο περί του Πάγκαλου στο Berkeley. Αμέσως μου κίνησε την περιέργεια. Τι αποτέλεσμα θα είχε το link; Για να δούμε τι είπαν τα νούμερα.

Μπορείτε να μαντέψετε πότε μπήκε το link; : )
Οπότε ένα
Ένα πολύ ενδιαφέρον κείμενο εδώ.
από τον Πιτσιρίκο μετράει περίπου…

… διακόσιες πενήντα επισκέψεις μέσα σε διάστημα τριών ημερών. Not bad. Βεβαίως, ένα τόσο ασαφές link δεν είναι και τόσο καλό. Αν κάποιος διαβάζει Πιτσιρίκο, και συγκεκριμένα ένα post για τη Γιουροβίζιον και την Άννα Βίσση, και ακολουθήσει το link και βγει σε σεντόνι για Ελληνοτουρκικές σχέσεις και τον Πάγκαλο, δυστυχώς μάλλον δε θα κάτσει να το διαβάσει πολύ προσεκτικά, και σίγουρα μάλλον δε θα ενδιαφερθεί και γενικότερα για τη σελίδα. Όντως, τα bounce rates δείχνουν πως 75% αυτών που ήρθαν στο post περί Πάγκαλου, δε πήγαν αλλού στο blog. (Τώρα, ήρθαν από monitor, από Πιτς, από το Google, δεν το διαβάσαν καν, το διαβάσαν αλλά κουραστήκαν από το σεντόνι και την κάνανε, ποιός ξέρει;)

Και το παρά πέντε καλά κρατεί!
Περί monetization της Ελληνικής μπλογκόσφαιρας
Η Ελληνική μπλογκόσφαιρα είναι ακόμα νεαρή και αθώα. Ίσως όχι τόσο νεαρή όσο τότε που το monitor είχε τριάντα blog, και ίσως όχι και τόσο αθώα. Αλλά ακόμη βασικά γράφουνε άτομα που γράφουνε για την πλάκα τους. Υπάρχουν κάποιοι που εκδίδονται, συγχαρητήρια by the way, και άλλοι που βγάζουν κάποια λεφτά από διαφημίσεις. Πάντως αυτές οι περιπτώσεις είναι αφενός εξαιρέσεις, αφετέρου δεν πιστεύω πως θα βγάζουν και πολλά — περισσότερο μάλλον τα βλέπουν σαν αναγνώριση.
Αλήθεια, πόσα λεφτά θα μπορούσε κανείς να ελπίζει να βγάλει από Ελληνικά blog; Ας κάνουμε ένα πολύ rough back-of-the-envelope υπολογισμό.
Θα χρησιμοποιήσω κάποιες φιγούρες από το Blogs to Riches, ένα ενδιαφέρον άρθρο που λίνκαρα πριν από μερικές μέρες.
Εκεί αναφέρει πως τα πιο πετυχημένα Αμερικάνικα blog έχουν 200000 pageviews την ημέρα, και υπολογίζεται πως βγάζουν $1 με $2 εκατομμύρια το χρόνο από διαφημίσεις, ενώ ένα blog με 30000 pageviews την ημέρα βγάζει ένα “comfortable five digit income,” το οποίο υποθέτω πως πρέπει να είναι τουλάχιστον $40000, και πιθανώς κοντά τα $80-90k.
Ας αρχίσουμε κάνοντας την τρελά λανθασμένη υπόθεση, πως τα ποσοστά ανθρώπων με σύνδεση Internet, και που κάθονται να διαβάσουν blog, μπορεί να φτάσει στην Ελλάδα τα Αμερικάνικα επίπεδα. Ας κάνουμε περαιτέρω την λανθασμένη υπόθεση, πως τα Αμερικάνικα blog τα διαβάζουν μονάχα Αμερικάνοι.
Οπότε έχουμε και λέμε. Η Αμερική, με βάση το CIA Fact Book, έχει 300 εκατομμύρια πληθυσμό. H Ελλάδα, πάλι με βάση την ίδια πηγή, έχει σχεδόν 11 εκατομμύρια.
Αν το καλύτερο Αμερικάνικο blog έχει 200k pageviews την ημέρα, τότε το καλύτερο Ελληνικό, χοντρικότατα μιλώντας, μπορεί να ελπίζει το πολύ σε 7.5k pageviews την ημέρα. Οπότε…
Αυτό δεν είναι κακό φυσικά. Σημαίνει πως δε θα πρέπει ν’ ανησυχούμε για τα πράγματα που αναφέρει το άνωθεν άρθρο. Πως τα blog θα παραμείνουν σχετικά αγνά by-the-people-for-the-people προϊόντα — αγνά as in no corporate funding, γιατί το άλλο το αγνό το έχουμε χάσει προ πολλού προφανώς.
Τέσπα, just thought I’d note that : )
Καλό σας Σαββατοκύριακο!
Πέραν από τη ‘τρελά λανθασμένη υπόθεση’ περι δημογραφικών των αναγνωστών αγγλόφωνων αμερικάνικων μπλόγκ, ξεχνάς και το Internet Penetration. Από εδώ:
Αντίθετα στην Ελλάδα, η χρήση του διαδικτύου από ιδιώτες/άτομα ήταν κοντά στο 20% του πληθυσμού σύμφωνα με αυτή την αναφορά της Eurostat που δημοσιεύθηκε τον περασμένο Μάιο και καλύπτει μέχρι και το τέλος του 2004..Και αναφέρομαι προφανώς στο σύνολο. Ένα μεγάλο μέρος αυτών των χρηστών απλώς έχουν μια συνδρομή και κοιτάζουν τα email τους μια φορά το μήνα.
Το θέμα: Νομίζω πως οποιοσδήποτε σκέφτεται να πλουτίσει έχωντας ελληνικό μπλόγκ καλό θα ήταν να αναθεωρήσει.
Κυρίως σε αυτό αναφερόμουν, sorry αν δεν ήταν προφανές.
Ναι απλά ανέφερα τη σημασία της διείσδυσης του διαδικτύου (internet penetration), σε συνδυασμό με τον πληθυσμό ως μετρική.
Προφανώς στη περίπτωση της πληθυσμιακής διαφοράς Ελλάδος-ΗΠΑ δεν έχει και τόσο μεγάλη σημασία (όπως π.χ. δεν θα έχει π.χ. σύντομα και στη περίπτωση Κίνας-ΗΠΑ, δηλ. η Κίνα με πολύ χαμηλό βιοτικό επίπεδο σύντομα θα έχει παραπάνω χρήστες του διαδικτύου από τις ΗΠΑ, μόνον και μόνον λόγω τεράστιου πληθυσμού), έστω και σε ακραίες περιπτώσεις, αλλά εν γένει είναι σημαντικός παράγοντας.
ωραιο το analytics, ετσι μουρχεται να το βαλουμε και μεις…
εχω μονο καποιες αντιρρησεις σε σχεση με το visitor loyalty. Γιατι η ΙΡ στους περισσοτερους ανθρωπους ειναι δυναμικη και αλλαζει ολη την ωρα. Ακομα και αν εχει τρακινγκ κουκις, πολλοι τα σβηνουν ή τα εχουν απενεργοποιημενα, σωστα?
και εχω και μια αλλη απορια: η διαρκεια της επισκεψης πως μετριεται? και αυτο πρεπει να ειναι μια δυσκολη προσεγγιση μου φαινετα…
Η διάρκεια επισκεψης μπορεί να μετρηθεί μόνο αν ο επισκέπτης δει και μια δεύτερη σελίδα. Τότε η χρονική διαφορά μεταξύ των επισκέψεων είναι η διάρκεια επίσκεψης στην πρώτη σελίδα. Αναγκαστικά, αν κάποιος δει μόνο μια σελίδα καταγράφεται ως μηδέν διάρκεια.
Ναι δεν νομιζω οτι μετριεται ετσι ακριβως, γιατι αυτο θα ηταν απλα λαθος. Βασικα για να προσεγγισουμε την διαρκεια επισκεψης αν εχουμε μονο γνωση του ποτε καποιος ανοιγει καθε σελιδα, θα επρεπε να κανουμε φανταζομαι μια censored regression…