Ergebnisse der Array-Umbau-Aufgabe

Bis heute morgen wurden von 18 Lesern 19 Lösungen zur vorgestrigen Array-Umbau-Aufgabe eingereicht, und ich habe alle Funktionen durchlaufen lassen mit einem Testarray. Nun möchte ich hier einige Werte zur Korrektheit und Laufzeit veröffentlichen.

Dazu habe ich ein Testscript erstellt, welches auf GitHub einsehbar ist, und wo ich alle Funktionen mit einem 29358 Elemente großen Array laufen lasse und dann die Laufzeit und Korrektheit der Umwandlungen überprüfe.

Hier die sortierbare Tabelle:

Autor	Notices/ Warnings	Korrektheit Compress/Decompress	Laufzeit Compress (in s)	Laufzeit Decompress (in s)
smares	Nein	Ja/Ja		2,450
max	Nein	Ja/Nein	0,023	0,044
Oliver 2	Nein	Ja/Ja	0,023	0,047
Stefan Gaudes	Nein	Ja/Ja	0,027	0,091
Lena Fuchs	Nein	Ja/Ja	0,037	24,868
Uwe	Nein	Ja/Ja	0,064	2,334
DukeNightcrawler	Nein	Ja/Ja	0,073	0,051
sprain	Nein	Ja/Ja	0,106	0,052
Wasrun	Nein	Ja/Ja	0,129	0,111
Sebastian	Nein	Ja/Ja	0,191	2,162
Daniel	Nein	Ja/Ja	0,204	4,212
Tobias Rohde	Nein	Ja/Ja	0,210	0,083
Oliver 1	Nein	Ja/Ja	0,250	0,277
Patrick	Nein	Ja/Ja	0,262	0,125
frank	Nein	Ja/Ja	0,266	2,296
Paloran	Nein	Nein/Ja	0,274	0,057
Artem	Nein	Ja/Ja	0,292	0,225
Martin Schäpker	Nein	Ja/Ja	0,423	4,650
Phil	Nein	Ja/Ja	0,599	23,710
chuckySTAR	Nein	Ja/Ja	2,956	2,966

Hinzu kommt eine Lösung von Andre in Haskell geschrieben, die ich aber nicht testen konnte.

Vielen Dank an alle, die mitgemacht haben. Wenn man sich die unterschiedlichen und vor allem auch die schnellsten Lösungen anschaut, ist man doch erstaunt wie man diese doch einfache Aufgabe lösen kann, und dass die einfachste oder naheliegendste Funktion nicht immer die schnellste ist.

Ihr könnt natürlich weiterhin eure Lösungen posten, ich (oder du vielleicht?) kann das GitHub-Repository von Zeit zu Zeit updaten.

Hier noch die Ausgabe des Testscripts:

https://github.com/PHPGangsta/Array-conversion-script/blob/master/README

Written by Michael Kliewe

Februar 9th, 2011 at 10:25 a.m.

Posted in PHP

Tagged with Algorithmus, Aufgabe, Wettbewerb

42 Responses to 'Ergebnisse der Array-Umbau-Aufgabe'

Subscribe to comments with RSS or TrackBack to 'Ergebnisse der Array-Umbau-Aufgabe'.

Doch immerhin 4. respektive 2. schnellste Lösung xD

DukeNightcrawler

9 Feb. 11 at 11:41
also dafür das ich nicht auf optimierung geachtet habe bin ich mit meinen platz auch zufrieden^^

wäre cool solche wettbewerbe öffters zu machen, da man auch viel lernt wenn man sich dann die anderen Lösungen anguckt

Wasrun

9 Feb. 11 at 12:34
Besser spät als nie!

Habe noch eine Lösung mit einer Lambda Funktion beim „unshorten“ erstellt.

http://pastie.org/1544779

Kannst ja noch in deiner Liste ergänzen wenn du willst. Hat auf jedenfall Spaß gemacht, mehr davon 😉

Sebastian Bruckner

9 Feb. 11 at 14:13
Haha ^^
Hätte nicht gedacht, dass array_splice sowas von viel Performance zieht!
Ich schäme mich für meine Laufzeit 🙁

chuckySTAR

9 Feb. 11 at 15:08
Schön 🙂

Oliver

9 Feb. 11 at 15:38
@WasRun, Sebastian: Ähnliche Probleme gibt es in regelmäßigen Abständen auf Programming Praxis [1]. Wer gerne mathematische Probleme mit dem Computer löst, wird bei Projekt Euler [2] sicherlich auch genügend Programmiermöglichkeiten finden.

[1] http://programmingpraxis.com/
[2] http://projecteuler.net/

Andre

9 Feb. 11 at 15:53
@Andre

fand es eher cool das hier in einen zeitlich beregnzen raum eine Lösung für ein problem gefunden werden muss und dabei auf preformance und nicht auf programmierschönheit geachtet wird.

Solche Projekte wo es schon 2000 Lösungen gibt und es nur darum geht irgendwelche Lösungen für komplizierte mathematische sachen zu finden, find ich recht langweilig

Wasrun

9 Feb. 11 at 16:13
coole Aktion, und der Tip von @Andre ist auch gut wenn man mal langeweile hat 🙂

das array_splice soviel Performance kostet, schon erschreckend. Programmierer lernen halt nie aus.

Martin Schäpker

9 Feb. 11 at 22:01
Soweit ich das sehe, schreibt array_splice den Index des Arrays neu. Damit schwindet dann die Geschwindigkeit. Bei so großen Arrays wie im Test ist es dann richtig tödlich, weil bei 1000 Werten, müssen 1000 Keys geändert werden.

Meine Funktion war am Anfang übrigens wesentlich langsamer als Lenas, weshalb ich hier und da etwas tricksen musste. 😉

Oliver

9 Feb. 11 at 22:39
Geschwindigkeit stimmt, Korrektheit nicht. Da musste ich nochmal ran 😉

http://pastie.org/1546647

compress() unterbietet die Zeit meine alter Funktion ein wenig, das sieht aber nicht schön aus… da kann man evtl. noch etwas optimieren.

Bei decompress() sehe ich nichts schnelleres als Olivers Lösung, die ist super!

Halten wir als Erkenntnis fest:
Ein if mit (abs($a-$b) == 1) ist langsam im Vergleich zu ($a+1 == $b && $a-1 == $b)

max

9 Feb. 11 at 22:48
@max
Danke, Deine neue Funktion gibt ein falsches Ergebnis, wenn eine Reihe am Ende ist.

array(13,81,80,79,78,77,76,19,40,41,42,43,44,45,48,49)

wird zu

Array ( [0] => 13 [1] => 81-76 [2] => 19 [3] => 40-45 [4] => 48-48 [5] => 49 )

Ansonsten wirklich sehr schnell. 🙂

Oliver

9 Feb. 11 at 22:58
Wie sieht es denn mit dem Speicherverbrauch der Lösungsansätze aus?

Jens

9 Feb. 11 at 23:13
@Sebastian: hinzugefügt

@max: Da Oliver noch einen Fehler gefunden hat warte ich noch mit einer Aktualisierung deiner Funktionen bis deine neue Version da ist 😉

@Jens: Dazu müßte man sie alle einzeln laufen lassen und mit memory_get_peak_usage() messen. Alle würden sich freuen wenn das jemand übernehmen könnte! Einfach das GitHub Repository forken und danach einen Pull-Request senden, ich merge es dann rein. Oder wenn das zu kompliziert ist das zip-File mit den Dateien hier posten, dann uploade ich es auf GitHub.

Michael Kliewe

9 Feb. 11 at 23:23
Kleine Korrektur meiner Lösung:
http://pastie.org/1546834

Jetzt taucht auch keine Notice mehr aus. Im Grunde war es nur der Positionstausch von Abfragebedingungen. Von der Geschwindigkeit her hat sich nicht viel getan, zumindest nach meiner Messmethode (microtime nach einem Funktionsaufruf minus microtime vor dem Funktionsaufruf).

Tobias Rohde

9 Feb. 11 at 23:33
@Tobias: upgedated, die Notice ist weg, Geschwindigkeit ist gleich geblieben.

Michael Kliewe

9 Feb. 11 at 23:46
mal so eine Anmwerkung wenn ich auf gist gehe und dann über den backbutton zurück dann steigt der Firefox jedesmal aus, liegt das an meinem System oder ist das ein allgemeins Problem?

Martin Schäpker

10 Feb. 11 at 00:09
@Martin: Bei mir klappts wunderbar. Stürzt Firefox komplett ab? Welche Firefox Version hast du?

Michael Kliewe

10 Feb. 11 at 00:17
Firefox 3.6.13 allerdings mit einer Menge Plugins aufgerüstet….

Martin Schäpker

10 Feb. 11 at 00:21
und ja der stürst komplett ab… sendet nur noch eine Fehlermeldung und sagt dann tschüss…

Martin Schäpker

10 Feb. 11 at 00:23
stürzt natürlich.. tztzt

Martin Schäpker

10 Feb. 11 at 00:24
@Oliver Ah, danke. Sollte mehr testen 😉

http://pastie.org/1547043

max

10 Feb. 11 at 00:26
Ich leg dann mal nach, weil so einen großen Abstand kann ich dann doch nicht stehen lassen. Es ist ca. 25 % schneller als das letzte und kommt damit ziemlich nah an max seins dran. 🙂

http://pastie.org/1547941

Oliver

10 Feb. 11 at 07:56
habe meine Lösung auch nochmal korrigiert

http://www.pastie.org/1548059

jetzt schneller und ohne Notice

Stefan Gaudes

10 Feb. 11 at 09:01
Hm, irgendwie kommt meine neue Version gar nicht an 🙁

Oliver

10 Feb. 11 at 16:45
So, ich habe mir mal die Mühe gemacht, und den Speicherverbrauch gemessen. Im Großen und ganzen liegen alle relativ dicht beeinander. Schade nur, dass Sebastian, der ein Kollege von mir ist, effizienter war als ich. 🙂

smares (326216 Byte; nur uncompress)
Oliver 2 (330264 Byte)
Daniel (330304 Byte)
Paloran (331600 Byte)
chuckySTAR (331792 Byte)
Lena Fuchs (331904 Byte)
Phil (333064 Byte; Ergebnis scheint in beide Richtungen nicht korrekt zu sein.)
Artem (337064 Byte)
Sebastian (337704 Byte)
DukeNightcrawler (346656 Byte)
max (350760 Byte)
Tobias Rohde (350944 Byte)
Stefan Gaudes (351048 Byte)
frank (351184 Byte)
Uwe (351192 Byte)
Patrick (351216 Byte)
Wasrun (351384 Byte)
Oliver 1 (351400 Byte)
Martin Schäpker (352504 Byte)

Tobias Rohde

10 Feb. 11 at 23:31
So, einen hätte ich dann noch 🙂

http://pastie.org/1551161

Oliver

11 Feb. 11 at 02:42
Mein letzter Code. Mehr kann ich nicht raus holen.

http://pastie.org/1551446

Oliver

11 Feb. 11 at 05:28
[…] Eine simple Aufgabenstellung erzeugte 19 Lösungsansätze von Lesern, mit äußerst unterschiedlichen Laufzeitverhalten: https://www.phpgangsta.de/ergebnisse-der-array-umbau-aufgabe […]

Lasset die Spiele beginnen « think.ahead

11 Feb. 11 at 09:47
@Oliver: Ich habe gerade 4 Kommentare von dir freigeschaltet, Akismet meinte das wäre Spam. Frag mich nicht woran das lag, vielleicht zu wenig Text und zu viele Links? 😉

Michael Kliewe

12 Feb. 11 at 02:31
Verdammter Spammer, ich 🙂

Ich hab da übrigens richtig Schwein gehabt. Die Funktion von max skaliert nämlich besser. Bei kleinen Arrays ist meine Funktion schneller – bei großen seine. 10.000 ist grade noch in dem Bereich, wo es minimal schneller ist. *gg*

Meinen tiefen Respekt für seine Vorlage.

Oliver

12 Feb. 11 at 04:22
Und wenn max seine neueste Version (http://pastie.org/1547043) noch weiter optimiert dann schafft er nochmals eine Verbesserung in der Geschwindigkeit von 11%.

– Deklaration des $ret-Array
– Präinkrement in der for-Schleife
– ===-Operator anstatt dem ==-Operator (achten auf 32-Bit/PHP_MAX_INT)

Version Original: 0.013093948364258s
Version Modifiziert: 0.011685848236084s

Wobei das wieder typische Mikro-Optimierungen sind. Wichtiger ist, wenn man von Anbeginn des Programmierens, „logisch“ korrekten Code schreibt.

Beispiel:
if (schnelleFunktion() || langsameFunktion())
if (langsameFunktion() || schnelleFunktion())

Die erste Variante ist schneller als die zweite da bei der Oder-Verknüpfung nur eine Bedingung erfüllt sein muss. So könnte man z.B. die Anfragen an die Datenbanken vermindern.

phpgangsta

14 Feb. 11 at 00:31
Habe den Link zu http://phpbar.de/w/Code-Optimierung vergessen, dort sind noch weitere Tipps wie man seinen Code optimieren kann. Auf http://net-beta.net/ubench/ sind auch nochmals Benchmarks verschiedener Vorgehensweisen aufgelistet.

phpgangsta

14 Feb. 11 at 00:37
Das ist interessant. Das hier sieht jetzt extrem seltsam aus, aber dieses Konstrukt ist etwa 25 % schneller als is_int().

if((int)$o===$o)) ...

Mit ein paar Änderungen sollte es jetzt bei etwa 0.0329 raus kommen.

http://pastie.org/1564671

Oliver

15 Feb. 11 at 01:16
So, schneller krieg ich meine Lösung nicht:

compress 0.038938999176025s
decompress 0.01375412940979s

http://www.pastie.org/1566441

DukeNightcrawler

15 Feb. 11 at 15:13
Ob das seltsam ist sei mal dahingestellt, da wir eben mit der schwachen/dynamischen Typisierung arbeiten. Ansonsten ist das Type-Casting mit die effizienteste Variante den Typ zu verändern ((array)$object). Ich habe gesehen, dass Du deine Array-Schlüssel als String behandelst was Du eigentlich gar nicht machen musst/solltest, da der Standard-Typ des Schlüssels ein Integer ist, sinnvoll ist es erst den Schlüssel als String zu behandeln wenn Du den maximalen Integerwert überschreitest.

phpgangsta

15 Feb. 11 at 15:37
Ich hatte es hier ausprobiert. $a[‚1‘] ist minimal schneller als $a[0] – ist jetzt kein Riesen Performancegewinn, aber schon messbar.

Seltsam fand ich nur, dass so ein seltsames Konstrukt schneller ist, als die eigentlich vorgesehene Funktion. Die Klammern wirken sich übrigens auch aus. Lässt man sie weg, sinkt die Ausführungszeit.

Oliver

15 Feb. 11 at 15:46
Stimmt, habe es eben ausprobiert, aber bei größeren Integerwerten ist dies langsamer. 10 Millionen Iterationen mit 100000000 = 1.0333909988403s und mit ‚100000000‘ = 1.352774143219s. Man sollte dennoch vorsichtig sein wie man auf die Array-Schlüssel zugreift bzw. sie deklariert werden, weil dies schnell zu Verwirrung führen kann, siehe Beispiel unten. Um auf die Performance zurückzukommen das Äquivalent von if((int)$o===$o) wäre if(intval($o)===$o), Funktionen sind in PHP aber immer?! langsamer als Konstrukte?!. Wenn Du aber nun deine eigene isInt-Funktion erstellst (function isInt($o) { return (int)$o===$o; } ) wäre diese wieder fast doppelt so langsam wie is_int(). Bezüglich dem Type-Casting steht im Manual „Type casting in PHP works much as it does in C: the name of the desired type is written in parentheses before the variable which is to be cast.“. Ansonsten ist das Type-Casting eine feine Sache.

var_dump(array_keys(array(‚1‘ => 0, ‚2147483647‘ => 0, 2147483648 => 0, ‚2147483648‘ => 0)));

array(4) {
[0]=>
int(1)
[1]=>
int(2147483647)
[2]=>
int(-2147483648)
[3]=>
string(10) „2147483648“
}

phpgangsta

15 Feb. 11 at 16:41
Ich habe mir im Laufe der Jahre angewöhnt immer ‚1‘ zu schreiben. KA warum 🙂

Bis auf solche Sachen hier, ist es ja meistens auch uninteressant, weil die Unterschiede in der Performance bei einzelnen Aufrufen eh keine Rolle spielen. Das mit den Funktionen wusste ich schon, allerdings, dass es so einen krassen Unterschied macht, hätte ich nicht gedacht.

Oliver

15 Feb. 11 at 21:02
Noch schneller als Max, trotz:
„- Deklaration des $ret-Array
– Präinkrement in der for-Schleife
– ===-Operator anstatt dem ==-Operator (achten auf 32-Bit/PHP_MAX_INT)“
Ist aber so ziemlich die gleiche Funktion ^^
http://pastie.org/1585872
Max: compress 0.010066032409668s
Neu: compress 0.0096249580383301s

Jetzt gehts doch wirklich nicht mehr schneller, oder?

chuckySTAR

20 Feb. 11 at 16:19
Mir fällt gerade auf, dass es noch so einige Spezialfälle gibt mit dem Array:
$origNumbers = array(13,81,80,79,78,79,77,76,19,40,41,42,43,44,45);
$origCompressed = array(13,“81-78″,79,“77-76″,19,“40-45″);
Das Ergebnis sieht etwas überraschend aus ^^

Daniel: compress 6.2942504882812E-5s
FEHLER ENTDECKT!
Daniel: decompress 5.6028366088867E-5s
Patrick: compress 5.2928924560547E-5s
Patrick: decompress 4.0054321289062E-5s
smares: decompress 4.6014785766602E-5s
chuckySTAR: compress 3.0994415283203E-5s
Phil: compress 7.7962875366211E-5s
Phil: decompress 3.504753112793E-5s
frank: compress 5.6982040405273E-5s
FEHLER ENTDECKT!
frank: decompress 3.3140182495117E-5s
Paloran: compress 3.0994415283203E-5s
FEHLER ENTDECKT!
Tobias: compress 4.6014785766602E-5s
FEHLER ENTDECKT!
Tobias: decompress 3.9100646972656E-5s
Lena: compress 3.1948089599609E-5s
FEHLER ENTDECKT!
Lena: decompress 3.9100646972656E-5s
Martin: compress 9.7036361694336E-5s
FEHLER ENTDECKT!
Martin: decompress 4.1007995605469E-5s
Oliver1: compress 0.00048589706420898s
FEHLER ENTDECKT!
Oliver1: decompress 0.00021886825561523s
Oliver2: compress 3.1948089599609E-5s
Oliver2: decompress 2.598762512207E-5s
Wasrun: compress 5.0067901611328E-5s
FEHLER ENTDECKT!
Wasrun: decompress 3.7908554077148E-5s
Duke: compress 4.6968460083008E-5s
Duke: decompress 3.0040740966797E-5s
Max: compress 2.1934509277344E-5s
FEHLER ENTDECKT!
Uwe: compress 3.814697265625E-5s
Uwe: decompress 3.504753112793E-5s
Stefan: compress 2.8848648071289E-5s
Stefan: decompress 3.3140182495117E-5s
sprain: compress 2.6941299438477E-5s
FEHLER ENTDECKT!
sprain: decompress 2.598762512207E-5s

Und noch mal eine schnellere Komprimierungsfunktion:
https://gist.github.com/815282

chuckySTAR

21 Feb. 11 at 22:47
@Tobias Rohde: Kannst du dein Speicherverbrauchs-Script veröffentlichen? Irgendwie kommen mir die Zahlen falsch vor, die werden alle nur größer, kann es sein dass du einfach memory_get_peak_usage() dazwischengebaut hast? Um die richtigen Werte zu messen muss man jeden Algorithmus in einem eigenen Scriptaufruf messen.

@chuckySTAR: Du meinst den Spezialfall, dass das letzte Element Teil einer Range ist? Ja, das ist korrekt, einige Algorithmen scheinen das nicht richtig abzufangen.

Michael Kliewe

22 Feb. 11 at 09:40
@Michael: Ich habe jedes Skript einzeln laufen lassen und in jedem memory_get_peak_usage() ausgeben lassen. Die Werte werden deshalb immer größer, weil ich sie von Hand der Reihe nach sortiert habe, damit jeder weiß, wo er steht.

Tobias Rohde

1 März 11 at 01:06

PHPGangsta - Der praktische PHP Blog

Ergebnisse der Array-Umbau-Aufgabe

42 Responses to 'Ergebnisse der Array-Umbau-Aufgabe'

Leave a Reply

Kategorien

Neueste Kommentare

Links

Tag Cloud

Administratives