Условие:
Допустим, что в нашем распоряжении некий дата фрейм df из пяти столбцов в указанном порядке:
firstname (имя)
lastname (фамилия)
emailaddress (электронная почта)
postaladdress (почтовый адрес)
dateadded (дата добавления записи в базу данных)
Какие из этих записей функции select пакета dplyr правильно использованы, чтобы получить только столбцы, содержащие имя, фамилию и дату?
select(df, contains("name"), dateadded)
select(df, -contains("add"))
df %>% select(c(1:2, 5))
select(df, firstname, lastname, dateadded)
select(df, -3:4)
select(df, matches("_.{4,5}quot;))
Решение:
Чтобы определить, какие из предложенных функций select из пакета dplyr правильно выбирают только столбцы, содержащие имя, фамилию и дату, давайте проанализируем каждую из них. 1. select(df, contains(name), dateadded): Эта функция выберет столбцы, содержащие name (то есть firstname и lastname), а также dateadded. Это правильный вариант, так как он включает нужные столбцы. 2. select(df, -contains(add)): Эта функция исключает столбцы, содержащие add. Это не совсем то, что нам нужно, так как мы не исключаем столбцы, а выбираем только нужные. Этот вариант неправ...
