Numpy как добавить элемент в массив
Перейти к содержимому

Numpy как добавить элемент в массив

  • автор:

Как добавить двумерный список в массив Numpy?

Имеется двумерный список s1=[[2,3],[4,5,6]] и двумерный список s2=[[7,8,9],[10,11],[12,13]] . Необходимо в массив a=np.array([]) добавить данные списки таким образом, чтобы во время итерации по массиву a выбирался целиком список s1 и целиком список s2 . Аналог данному результату c использованием обычных списков будет выглядеть так:

s1=[[2,3],[4,5,6]] s2=[[7,8,9],[10,11],[12,13]] s3=[] s3.append(s1) s3.append(s2) for i in s3: print(i) #[[2, 3], [4, 5, 6]] #[[7, 8, 9], [10, 11], [12, 13]] 

Если использовать функцию np.append , то граница между списками s1 и s2 в массиве a стирается и все списки и подсписки записывается подряд в одномерный массив:

import numpy as np s1=[[2,3],[4,5,6]] s2=[[7,8,9],[10,11],[12,13]] a=np.array([]) a=np.append(a,s1) a=np.append(a,s2) for i in a: print(i) #[2, 3] #[4, 5, 6] #[7, 8, 9] #[10, 11] #[12, 13] 

Таким образом, мне необходим результат как в первом варианте кода, только чтобы данные списков s1 и s2 содержались в массиве. Проще говоря, добавить двумерные списки в массив numpy .

Как добавить элементы в массив NumPy (3 примера)

Вы можете использовать следующие методы для добавления одного или нескольких элементов в массив NumPy:

Способ 1: добавить одно значение в конец массива

#append one value to end of array new_array = np.append(my_array, 15) 

Способ 2: добавить несколько значений в конец массива

#append multiple values to end of array new_array = np.append(my_array, [15, 17, 18]) 

Способ 3: вставить одно значение в определенную позицию в массиве

#insert 95 into the index position 2 new_array = np.insert (my_array, 2, 95) 

Способ 4: вставить несколько значений в определенную позицию в массиве

#insert 95 and 99 starting at index position 2 of the NumPy array new_array = np.insert (my_array, 2, [95, 99]) 

В этом руководстве объясняется, как использовать каждый метод на практике со следующим массивом NumPy:

import numpy as np #create NumPy array my_array = np.array([1, 2, 2, 3, 5, 6, 7, 10]) #view NumPy array my_array array([ 1, 2, 2, 3, 5, 6, 7, 10]) 

Пример 1: добавление одного значения в конец массива

В следующем коде показано, как использовать np.append() для добавления одного значения в конец массива NumPy:

#append one value to end of array new_array = np.append(my_array, 15) #view new array new_array array([ 1, 2, 2, 3, 5, 6, 7, 10, 15]) 

В конец массива NumPy добавлено значение 15 .

Пример 2. Добавление нескольких значений в конец массива

В следующем коде показано, как использовать np.append() для добавления нескольких значений в конец массива NumPy:

#append multiple values to end of array new_array = np.append(my_array, [15, 17, 18]) #view new array new_array array([ 1, 2, 2, 3, 5, 6, 7, 10, 15, 17, 18]) 

Значения 15 , 17 и 18 были добавлены в конец массива NumPy.

Пример 3. Вставка одного значения в определенную позицию в массиве

В следующем коде показано, как вставить одно значение в определенную позицию в массиве NumPy:

#insert 95 into the index position 2 new_array = np.insert (my_array, 2, 95) #view new array new_array array([ 1, 2, 95, 2, 3, 5, 6, 7, 10]) 

Значение 95 было вставлено в позицию индекса 2 массива NumPy.

Пример 4. Вставка нескольких значений в определенную позицию в массиве

В следующем коде показано, как вставить несколько значений, начиная с определенной позиции в массиве NumPy:

#insert 95 and 99 starting at index position 2 of the NumPy array new_array = np.insert (my_array, 2, [95, 99]) #view new array new_array array([ 1, 2, 95, 99, 2, 3, 5, 6, 7, 10]) 

Значения 95 и 99 были вставлены, начиная с позиции индекса 2 массива NumPy.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в NumPy:

Добавление элементов в массив в Python

В Python нет встроенного типа данных “массив”, но есть модули, которые позволяют работать с массивами. В этой статье мы рассмотрим, как добавлять данные в массив с помощью модулей array и NumPy. Модуль array полезен, когда нужно создать массив целых чисел и чисел с плавающей точкой. А модуль NumPy пригодится, когда вам нужно выполнить математические операции с массивом.

Во многих случаях создать массив вы можете с помощью List, поскольку он обеспечивает гибкость (например смешанные типы данных) и по-прежнему обладает всеми характеристиками массива.

Примечание: в массив можно добавлять только элементы одного типа данных. Соответственно, объединять можно только два массива с одинаковым типом данных.

Добавление элементов в массив

С помощью модуля array можно объединять массивы при помощи оператора + и добавлять элементы в массив методами append(), extend() и insert().

  • Оператор +, x + y: возвращает новый массив с элементами из двух массивов.
  • append(x): добавляет один элемент в конец массива.
  • extend(iterable): добавляет список, массив или другую итерабельную переменную в конец массива.
  • insert(i, x): вставляет элемент перед заданным индексом массива.

В следующем примере показано, как создать новый объект массива путем объединения двух других массивов:

import array # create array objects, of type integer arr1 = array.array('i', [1, 2, 3]) arr2 = array.array('i', [4, 5, 6]) # print the arrays print("arr1 is:", arr1) print("arr2 is:", arr2) # create a new array that contains all of the elements of both arrays # and print the result arr3 = arr1 + arr2 print("After arr3 = arr1 + arr2, arr3 is:", arr3)

Получим следующий вывод:

arr1 is: array('i', [1, 2, 3]) arr2 is: array('i', [4, 5, 6]) After arr3 = arr1 + arr2, arr3 is: array('i', [1, 2, 3, 4, 5, 6])

В предыдущем примере создается новый массив, в котором содержатся все элементы заданных массивов.

А в следующем примере показано, как добавлять данные в массив с помощью методов append(), extend() и insert():

import array # create array objects, of type integer arr1 = array.array('i', [1, 2, 3]) arr2 = array.array('i', [4, 5, 6]) # print the arrays print("arr1 is:", arr1) print("arr2 is:", arr2) # append an integer to an array and print the result arr1.append(4) print("\nAfter arr1.append(4), arr1 is:", arr1) # extend an array by appending another array of the same type # and print the result arr1.extend(arr2) print("\nAfter arr1.extend(arr2), arr1 is:", arr1) # insert an integer before index position 0 and print the result arr1.insert(0, 10) print("\nAfter arr1.insert(0, 10), arr1 is:", arr1)

Получаем следующий вывод:

arr1 is: array('i', [1, 2, 3]) arr2 is: array('i', [4, 5, 6]) After arr1.append(4), arr1 is: array('i', [1, 2, 3, 4]) After arr1.extend(arr2), arr1 is: array('i', [1, 2, 3, 4, 4, 5, 6]) After arr1.insert(0, 10), arr1 is: array('i', [10, 1, 2, 3, 4, 4, 5, 6])

В предыдущем примере каждый метод вызывается на объекте массива arr1 и изменяет исходный объект.

Добавление элементов в массив NumPy

С модулем NumPy вы можете использовать функции NumPy append() и insert() для добавления элементов в массив.

  • numpy.append(arr, values, axis=None): добавляет значения или массив в конец копии arr. Если параметр axis не указан, то по умолчанию используется значение None, что означает, что arr и values выравниваются перед операцией append.
  • numpy.insert(arr, obj, values, axis=None): вставляет значения или массив перед индексом (obj) вдоль оси. Если параметр axis не указан, то по умолчанию используется значение None, что означает, что перед операцией insert выравнивается только arr.

numpy.append() использует функцию numpy.concatenate() в фоновом режиме. Метод numpy.concatenate() объединяет последовательность массивов вдоль указанной оси. Узнать больше о работе с массивами вы можете в документации NumPy.

Примечание: для тестирования примеров кода в этом разделе необходимо установить NumPy .

Примеры на этом этапе используют двумерные (2D) массивы, чтобы показать, как функции обрабатывают массивы в зависимости от значения axis.

Добавление в массив с помощью numpy.append()

Массивы NumPy можно описать по размеру и форме. При добавлении значений или массивов в многомерные массивы добавляемый массив или значения должны иметь одинаковую форму, за исключением указанной оси.

Чтобы понять форму 2D массива, рассмотрим строки и столбцы. array([[1, 2], [3, 4]]) имеет форму 2, 2, эквивалентную 2 строкам и 2 столбцам; array([[10, 20, 30], [40, 50, 60]] ) имеет форму 2, 3, эквивалентную 2 строкам и 3 столбцам.

Протестируйте эту концепцию с помощью интерактивной консоли Python.

Сначала импортируйте модуль NumPy, затем создайте несколько массивов и проверьте их форму.

Импортируйте NumPy, затем создайте и выведите np_arr1:

import numpy as np np_arr1 = np.array([[1, 2], [3, 4]]) print(np_arr1)

Получим следующий вывод:

[[1 2] [3 4]]

Проверьте форму np_arr1:

np_arr1.shape (2, 2)

Создайте и выведите ещё один массив, np_arr2:

np_arr2 = np.array([[10, 20, 30], [40, 50, 60]]) print(np_arr2) [[10 20 30] [40 50 60]]

Проверьте форму np_arr2:

np_arr2.shape (2, 3)

Затем попробуйте добавить массивы по разным осям. Вы можете добавить массив формы 2, 3 к массиву формы 2, 2 вдоль оси 1, но не вдоль оси 0.

Добавьте np_arr2 к np_arr1 вдоль axis 0 или по строкам:

np.append(np_arr1, np_arr2, axis=0)

Вы получите ошибку ValueError:

Traceback (most recent call last): File "", line 1, in File "", line 5, in append File "/Users/digitalocean/opt/anaconda3/lib/python3.9/site-packages/numpy/lib/function_base.py", line 4817, in append return concatenate((arr, values), axis=axis) File "", line 5, in concatenate ValueError: all the input array dimensions for the concatenation axis must match exactly, but along dimension 1, the array at index 0 has size 2 and the array at index 1 has size 3

Выполнить добавление массива с тремя столбцами в массив с двумя столбцами невозможно.

Вы можете добавить массив np_arr2 к np_arr1 вдоль оси 1, то есть по столбцам:

np.append(np_arr1, np_arr2, axis=1)

Вывод будет следующим:

array([[ 1, 2, 10, 20, 30], [ 3, 4, 40, 50, 60]])

Вы можете добавить массив со столбцами высотой в две строки к другому массиву со столбцами высотой в две строки.

В следующем примере показано, как добавлять элементы в массив NumPy с помощью функции numpy.append():

import numpy as np # create 2D array objects (integers) np_arr1 = np.array([[1, 2], [3, 4]]) np_arr2 = np.array([[10, 20], [30, 40]]) # print the arrays print("np_arr1 is:\n", np_arr1) print("np_arr2 is:\n", np_arr2) # append an array to the end of another array and print the result # both arrays are flattened before appending append_axis_none = np.append(np_arr1, np_arr2, axis=None) print("append_axis_none is:\n", append_axis_none) # append an array to the end of another array along axis 0 (append rows) # and print the result append_axis_0 = np.append(np_arr1, np_arr2, axis=0) print("append_axis_0 is:\n", append_axis_0) # append an array to the end of another array along axis 1 (append columns) # and print the result append_axis_1 = np.append(np_arr1, np_arr2, axis=1) print("append_axis_1 is:\n", append_axis_1)

Получаем следующий вывод:

np_arr1 is: [[1 2] [3 4]] np_arr2 is: [[10 20] [30 40]] append_axis_none is: [ 1 2 3 4 10 20 30 40] append_axis_0 is: [[ 1 2] [ 3 4] [10 20] [30 40]] append_axis_1 is: [[ 1 2 10 20] [ 3 4 30 40]]

Предыдущий пример демонстрирует работу функции numpy.append() для каждой оси 2D-массива и как изменяется форма полученного массива. Если ось равна 0, массив дополняется строками. Если ось равна 1, массив дополняется столбцами.

Добавление элементов в массив с помощью numpy.insert()

Функция numpy.insert() вставляет массив или значения в другой массив перед указанным индексом вдоль оси и возвращает новый массив.

В отличие от функции numpy.append(), если ось не указана или указана как None, то функция numpy.insert() сглаживает только первый массив и не сглаживает значения или массив, которые нужно вставить. Если вы попытаетесь вставить 2D-массив в другой 2D-массив без указания оси, то вы получите ошибку ValueError.

В следующем примере показано, как вставлять элементы в массив с помощью функции numpy.insert():

import numpy as np # create array objects (integers) np_arr1 = np.array([[1, 2], [4, 5]]) np_arr2 = np.array([[10, 20], [30, 40]]) np_arr3 = np.array([100, 200, 300]) # print the arrays print("np_arr1 is:\n", np_arr1) print("np_arr2 is:\n", np_arr2) print("np_arr3 is:\n", np_arr3) # insert a 1D array into a 2D array and then print the result # the original array is flattened before insertion insert_axis_none = np.insert(np_arr1, 1, np_arr3, axis=None) print("insert_axis_none is:\n", insert_axis_none) # insert an array into another array by row # and print the result insert_axis_0 = np.insert(np_arr1, 1, np_arr2, axis=0) print("insert_axis_0 is:\n", insert_axis_0) # insert an array into another array by column # and print the result insert_axis_1 = np.insert(np_arr1, 1, np_arr2, axis=1) print("insert_axis_1 is:\n", insert_axis_1)

Вывод будет следующим:

np_arr1 is: [[1 2] [4 5]] np_arr2 is: [[10 20] [30 40]] insert_axis_none is: [ 1 100 200 300 2 4 5] insert_axis_0 is: [[ 1 2] [10 20] [30 40] [ 4 5]] insert_axis_1 is: [[ 1 10 30 2] [ 4 20 40 5]]

В предыдущем примере, когда вы вставляли 2D-массив в другой 2D-массив вдоль оси 1, каждый массив в np_arr2 был вставлен как отдельный столбец в np_arr1. Если вы хотите вставить целый 2D-массив в другой 2D-массив, добавьте квадратные скобки вокруг значения obj, чтобы указать, что весь массив должен быть вставлен перед этой позицией. Без квадратных скобок numpy.insert() складывает массивы по порядку в виде столбцов перед заданным индексом.

В следующем примере показан вывод с квадратными скобками вокруг значения параметра obj (index) и без них:

import numpy as np # create 2D array objects (integers) np_arr1 = np.array([[1, 2], [3, 4]]) np_arr2 = np.array([[10, 20], [30, 40]]) # print the arrays print("np_arr1 is:\n", np_arr1) print("np_arr2 is:\n", np_arr2) # insert an array, column by column, into another array # and print the result insert_axis_1 = np.insert(np_arr1, 1, np_arr2, axis=1) print("insert_axis_1 is:\n", insert_axis_1) # insert a whole array into another array by column # and print the result insert_index_axis_1 = np.insert(np_arr1, [1], np_arr2, axis=1) print("insert_index_axis_1 is:\n", insert_index_axis_1)

Вы получите следующий вывод:

np_arr1 is: [[1 2] [3 4]] np_arr2 is: [[10 20] [30 40]] insert_axis_1 is: [[ 1 10 30 2] [ 3 20 40 4]] insert_index_axis_1 is: [[ 1 10 20 2] [ 3 30 40 4]]

В предыдущем примере показано, как numpy.insert() вставляет столбцы в массив в зависимости от обозначенного index.

Подводим итоги

В этом мануале мы добавили элементы в массивы с помощью модулей array и NumPy.

Многомерные массивы в Numpy — Python: Numpy-массивы

Библиотека Numpy дает мощный и удобный высокоуровневый аппарат для работы с многомерными данными. Для работы с ними в Numpy разработана своя собственная структура данных — массив numpy.ndarray . Именно под эту структуру оптимизирована работа всего функционала библиотеки.

В этом уроке познакомимся с тем, как создавать массив ndarray из стандартных типов данных языка Python и попробуем на практике решить ряд простых аналитических задач.

Структура данных библиотеки Numpy

Чтобы создать структуру numpy.ndarray , нужно конвертировать список list . Для конвертации из множества set требуется дополнительное приведение типа данных.

Рассмотрим на таком примере:

# Импортируем библиотеку numpy с псевдонимом np import numpy as np # Создаем простой пример списка языка Python simple_list = [1, 2, 3, 4, 5] # Конвертируем созданный список в массив Numpy my_first_ndarray = np.array(simple_list, dtype=int) # Тип созданного объекта print(type(my_first_ndarray)) # => # Результат стандартного вывода print(my_first_ndarray) # => [1 2 3 4 5] 

А теперь разберем этот код подробнее. Сам пример показывает встроенную функциональность для создания структуры numpy.ndarray . Мы импортируем библиотеку Numpy, создаем короткий список значений simple_list , а затем конвертируем в массив my_first_ndarray . Для этого вызываем конструктор np.array() с объектами для конвертации.

С учетом примера выше, обратная конвертация в список происходит так:

print(ndarray_from_list.tolist()) 

Конвертация из списка Python — это самая популярная операция, с помощью которой создается структура numpy.ndarray .

Так происходит потому, что обмен данными между функциями и сервисами удобно производить в стандартных структурах данных языка. Другими словами, можно не вводить структуры данных сторонних библиотек и не усложнять программу.

Но при разработке сложных программ модуль numpy.ndarray может быть только частью общей структуры. В таких случаях используют стандартные типы данных языка для обмена данными между функциональными частями программ.

В итоге порядок работы с данными при работе с Numpy выглядит следующим образом:

Как правило, вычислительные и аналитические модули в виде входных данных ожидают списки значений. Всю оптимизацию они делают уже внутри себя в собственных абстракциях, невидимых извне. Это сделано для простоты интеграции.

Допустимые типы данных

Поговорим подробнее о типах элементов массива, которые можно использовать для numpy.ndarray . Продолжим работать с тем же примером и воспользуемся следующим методом:

# Проверяем тип полученного массива print(my_first_ndarray.dtype.type) # => 

Как и ожидалось, тип данных — int64. Необязательно ограничиваться только им:

# Целочисленный массив print(np.array([1, 2, 3], dtype=int).dtype.type) # => # Массив строк print(np.array([1, 2, 3], dtype=str).dtype.type) # => # Массив чисел с плавающей запятой print(np.array([1, 2, 3], dtype=float).dtype.type) # => 

Обратите внимание, что для экземпляра структуры numpy.ndarray нельзя использовать сразу несколько типов данных. Проще говоря, все элементы в массиве должны быть однотипные. Посмотрим, как конструктор сам определит тип данных при конвертации:

# Все элементы списка целочисленные print(np.array([1, 2, 3]).dtype.type) # => # Все элементы списка — это строки print(np.array(['1', '2', '3']).dtype.type) # => # Элементы списка как текстовые, так и целочисленные print(np.array(['1', 2, 3]).dtype.type) # => 

Заметим, что ошибки при конвертации смешанного типа элементов массива не произошло. Конвертор просто привел все данные к строковому типу.

Как Numpy работает на практике

Функциональность библиотеки Numpy настолько интуитивна, что уже сейчас можно решить простую аналитическую задачку.

Представим продажи ноутбуков в магазине за одну неделю:

День Магазин №1
0 7
1 4
2 3
3 8
4 15
5 21
6 25

На практике такие данные обычно хранятся в табличном виде в базе данных. Чтобы упростить пример, мы пропустили этап выгрузки — подразумевается, что данные приходят в вычислительный модуль уже в виде списка значений.

Поработаем с данными с помощью библиотеки Numpy:

# Импортируем библиотеку numpy с псевдонимом np import numpy as np # Создаем список продаж — представим, что считали его из базы данных orders_list = [7, 4, 3, 8, 15, 21, 25] # Конвертируем созданный список в массив Numpy orders_ndarray = np.array(orders_list, dtype=int) # Тип созданного объекта print(type(orders_ndarray)) # => # Результат стандартного вывода print(orders_ndarray) # => [ 7 4 3 8 15 21 25] 

Попробуем найти день недели с самыми низкими продажами. Опыт работы с Python подсказывает, что метод будет называться min() или minimum() . Найдем минимальное количество продаж и заодно день недели, в который оно совершено:

# Находим минимальный элемент массива print(orders_ndarray.min()) # => 3 # Находим порядковый номер минимального элемента массива print(orders_ndarray.argmin()) # => 2 

Чтобы найти наибольшее количество продаж, достаточно поменять одну функцию:

# Находим максимальный элемент массива print(orders_ndarray.max()) # => 25 

На практике часто анализ не ограничивается только одной неделей продаж и одним магазином. В этом случае набор данных представлен в виде списка списков элементов — это уже двумерная структура, которая в математике называется матрицей.

В Numpy реализация инициализации массивов и функций работы с ними не зависит от размерности данных, что существенно упрощает разработку.

В современных библиотеках можно применять одну и ту же функцию к различным типам данных. Рассмотрим это на примере, похожем на предыдущий. Найдем день с самыми низкими доходами во всей сети магазинов. Рассмотрим недельные продажи в четырех магазинах:

День Магазин №1 Магазин №2 Магазин №3 Магазин №4
0 7 1 7 8
1 4 2 4 5
2 3 5 2 3
3 8 12 8 7
4 15 11 13 9
5 21 18 17 21
6 25 16 25 17

Мы ожидаем, что функционально все должно быть реализовано похожим образом. Давайте в этом убедимся, взглянув на код:

# Импортируем библиотеку numpy с псевдонимом np import numpy as np # Создаем «список списков продаж» orders_list = [ [7, 1, 7, 8], [4, 2, 4, 5], [3, 5, 2, 3], [8, 12, 8, 7], [15, 11, 13, 9], [21, 18, 17, 21], [25, 16, 25, 17] ] # Конвертируем созданный «список списков» в массив Numpy orders_ndarray = np.array(orders_list, dtype=int) # Описываем тип созданного объекта print(type(orders_ndarray)) # => # Находим минимальный элемент массива print(orders_ndarray.min()) # => 1 

В приведенном примере метод min() находит минимальный элемент среди всех значений массива.

Большинство функций в Numpy реализованы так, что методы и функции выполняют одинаковые операции, вне зависимости от типа данных на входе.

В программировании такой подход называется полиморфизмом. Он упрощает разработку и делает код более простым для анализа и поддержки.

Выводы

Сегодня мы познакомились с основной структурой данных библиотеки Numpy — массивом numpy.ndarray .

Открыть доступ

Курсы программирования для новичков и опытных разработчиков. Начните обучение бесплатно

  • 130 курсов, 2000+ часов теории
  • 1000 практических заданий в браузере
  • 360 000 студентов

Наши выпускники работают в компаниях:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *