Этой заметкой открываю серию статей для начинающих вкатываться в Data Sciеnce и Machine Learning и начнем мы с изучения Pandas. В интернете много статей по Pandas, поэтому хотел бы в этой заметки описать практические приемы для работы с Pandas в Data Sciеnce проектах и для построения моделей.
В качестве датасета будем использовать German Credit Risk на Kaggle
Датасет содержит информацию о кредитных данных:
- Age (возраст)
- Sex (пол)
- Job (работа)
- Housing (тип жилья)
- Saving accounts (сберегательные счета)
- Checking account (расчетный счет)
- Credit amount (сумма кредита)
- Duration (продолжительность кредита)
- Purpose (цель кредита)
