от
Чтобы перефразировать это, я генерирую некоторые фиктивные данные. Предполагая список клиентов (некоторые с несколькими транзакциями), я хочу отметить каждого уникального клиента. Затем я создам соответствующую личную информацию, такую как пол, идентификатор клиента и т. Д. Мои шаги были:   1) Создать список всех уникальных имен   2) перебрать столбец «Имена» в моем Dataframe   3) когда значение в списке уникальных имен и в «именах» DataFrame совпадает, добавьте 1 к списку (затем удалите имя из списка уникальных имен, создавая 0 для каждого последующего экземпляра имени). Или оставьте 0, если он не совпадает. Я перепробовал несколько методов, но ни один из них, похоже, не сработал, этот показался мне наиболее близким, но я не смог найти ответ. Сначала DataFrame
customers = [ ('jack', 34), 
             ('tom', 30),
             ('jack', 31),
             ('jack', 32),
             ('jon', 16),
             ('tim', 17)  ]
Создать объект DataFrame df = pd.DataFrame (клиенты, столбцы = ['Name', 'Age']) 1) создать список уникальных имен
uniques = df.Name.unique().tolist()
uniques
2,3)
worklist = []

for i in df:
    if df["Name"] == uniques[i]:
        worklist.append(i)
        uniques.remove(i)
    else:
        worklist.append(0)

print(worklist)
print(uniques)
В конце у меня должен быть список фиктивных переменных (1,0 с)   Аналогично, список уникальных имен должен быть пустым. Тем не менее, я постоянно получаю эту ошибку. Ошибка типа: индексы списка должны быть целыми числами или частями, а не str              

Ваш ответ

Отображаемое имя (по желанию):
Конфиденциальность: Ваш электронный адрес будет использоваться только для отправки уведомлений.
Анти-спам проверка:
Чтобы избежать проверки в будущем, пожалуйста войдите или зарегистрируйтесь.
Добро пожаловать на сайт ByNets, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...