Programovanie

Pandas 1.0 prináša veľké zlomové zmeny

Pandas, knižnica na analýzu údajov pre Python, konečne dosiahla kandidáta na vydanie verzie 1.0. Pandas 1.0 odstraňuje veľké množstvo zastaraných funkcií a vyžaduje Python 3.6 alebo lepší.

Pandy boli vytvorené pre ľahkú prácu s údajmi v štruktúrovaných formátoch, ako sú tabuľky, matice a údaje časových radov. Pandas zatieni väčšinu funkcií dátových rámcov R a funguje dobre s ostatnými vedeckými výpočtovými knižnicami vo svete Pythonu.

S Pandas 1.0 tvoria tvorcovia Pandas množstvo prelomových zmien, ktoré už nejaký čas fungujú. Tu je zhrnutie tých najvýznamnejších a o tom, ako s nimi zaobchádzať do budúcnosti.

Pandy vyžadujú Python 3.6.1 alebo vyšší

Najväčšou zmenou v Pandas 1.0 je zrušenie podpory pre všetky verzie Pythonu staršie ako Python 3.6.1. Spoločnosť Pandas zrušila podporu pre Python 2 a od roku 2019 sa zaviazala výhradne k Pythonu 3, takže ide väčšinou o vylepšenie existujúcej politiky.

Projekt má tiež novú politiku podpory pre budúce verzie programu Pandas. Akýkoľvek pokles podpory pre verziu Pythonu bude zavedený v hlavných nových verziách Pandas (2.0, 3.0 atď.). Menšie vydania budú zastarané, ale neodstránia ich; hlavné vydania odstránia funkcie.

Pandasova nová hodnota NA

Staršie verzie Pandy používali rôzne typy na zastupovanie chýbajúcich údajov v závislosti od typu kontajnera - jeden pre typy datetime a druhý pre objekty atď. Všetky tieto údaje sa zlúčia do jedného typu chýbajúcich údajov s názvom NA. Momentálne je podpora NA obmedzená na niekoľko typov objektov a je považovaná za experimentálnu, takže by sa zatiaľ nemala používať pri výrobe.

Nekompatibility API

Kvôli množstvu zmien v Pandas 1.0 sú niektoré API od Pandas spätne nekompatibilné. Patria sem zmeny v správaní mnohých bežných prvkov:

  • The DataFrame typu
  • pandas.array
  • polia.IntegerArray

Mnoho z týchto nekompatibilít vyvolá varovania, ale je najlepšie otestovať existujúce skripty Pandas bok po boku so svojimi kolegami z Pandas 1.0 a zistiť, ako fungujú.

Zastarané funkcie v Pandas 1.0

Dokumentácia Pandas uvádza všetky funkcie, ktorých podpora v Pandas 1.0 bude ukončená, ale neodstránia sa. Niektoré z nich boli jednoducho premenované alebo reorganizované, napríklad testovací modul, zatiaľ čo iné menia použitie určitých funkčných parametrov. V niekoľkých prípadoch, napríklad s Series.item () a Index.item (), funkcie boli zachránené pred ukončením podpory a budú naďalej dostupné.

Ak používate verziu Pandy staršiu ako 0,25, tvorcovia Pandy odporúčajú migráciu na verziu Pandas 0,25najprv, uistite sa, že sa všetky kódy závislé od Pandy správajú podľa očakávania,potom migrácia na Pandas 1.0. To zaisťuje, že každý kód, ktorý používa zastarané funkcie, bude označený.

Funkcie odstránené v Pandas 1.0

Niektoré kľúčové funkcie Pandy boli v Pandas 1.0 úplne odstránené:

  • SparseSeries a SparseDataFrame. Použite Séria alebo DataFrame s sparsevalues namiesto toho možnosť.
  • Registrácia jednotky Matplotlib. To nezabráni ovplyvneniu Matplotlibu pri importovaní pandy.
  • Mnoho ďalších funkcií, ktoré boli predtým zastarané.

Opäť je to ďalší dôvod na testovanie kandidáta na vydanie Pandas 1.0 vedľa seba s vašou existujúcou inštaláciou Pandas a na zaistenie správnosti vašich skriptov.

Inštalácia Pandas 1.0

Pandy 1.0 je možné nainštalovať priamo do Pythonu pomocou správcu balíkov Pip zadaním príkazu pip nainštaluj pandy. Pandas 1.0 je k dispozícii aj ako súčasť distribúcie Anaconda Python pre vedecké výpočty.

Vo všetkých prípadoch je najlepšie nainštalovať program Pandas vo virtuálnom prostredí, najmä ak chcete spúšťať testy skriptov programu Pandas 1.0 vedľa seba s kolegami v staršej verzii.

$config[zx-auto] not found$config[zx-overlay] not found