from datascience import *
import numpy as np


my_array = make_array(1, 2, 3, 4)
my_array

array([1, 2, 3, 4])

my_array = make_array(1, 2, 3, 4)
my_array


string_array = make_array("cat", "dog", "bird")
string_array

array(['cat', 'dog', 'bird'],
      dtype='<U4')

string_array = make_array("cat", "dog", "bird")
string_array


weird_array = make_array("cat", 3, True)
weird_array

array(['cat', '3', 'True'],
      dtype='<U21')

weird_array = make_array("cat", 3, True)
weird_array


make_array(0, 1, 2, 3, 4, 5, 6)

array([0, 1, 2, 3, 4, 5, 6])


np.arange(0, 7, 1)

array([0, 1, 2, 3, 4, 5, 6])


np.arange(0, 7)

array([0, 1, 2, 3, 4, 5, 6])


np.arange(7)

array([0, 1, 2, 3, 4, 5, 6])


np.arange(40, -1, -5)

array([40, 35, 30, 25, 20, 15, 10,  5,  0])


string_array = make_array("cat", "dog", "bird")
string_array

array(['cat', 'dog', 'bird'],
      dtype='<U4')


string_array.item(1)

'dog'


string_array[1]

'dog'


len(string_array)

3

len(string_array)


string_array.size

3

string_array.size


cool_numbers = make_array(0, 1, 42, np.pi, np.e)
cool_numbers

array([  0.        ,   1.        ,  42.        ,   3.14159265,   2.71828183])


print("sum", cool_numbers.sum())
print("min", cool_numbers.min())
print("mean", cool_numbers.mean())
print("max", cool_numbers.max())

sum 48.859874482
min 0.0
mean 9.77197489641
max 42.0

print("sum", cool_numbers.sum())
print("min", cool_numbers.min())
print("mean", cool_numbers.mean())
print("max", cool_numbers.max())


print("np.average", np.average(my_array))
print("np.mean", np.mean(my_array))
print("np.log", np.log(my_array))

np.average 2.5
np.mean 2.5
np.log [ 0.          0.69314718  1.09861229  1.38629436]


a = make_array(1, 2, 3, 4)
b = make_array(10, 20, 30, 40)
print("The a array:", a)
print("The b array:", b)

The a array: [1 2 3 4]
The b array: [10 20 30 40]


a + b

array([11, 22, 33, 44])


a * b

array([ 10,  40,  90, 160])

print("Adding Arrays", a + b)
print("Multiplying Arrays", a * b)


a * 3.

array([  3.,   6.,   9.,  12.])


3 + b

array([13, 23, 33, 43])

bigger_array = make_array(1,2,3,4,5)
a * bigger_array


# bigger_array = make_array(1,2,3,4,5)
# a * bigger_array

uhoh = make_array(0,1,2,3)
a / uhoh


# uhoh = make_array(0,1,2,3)
# a / uhoh

a.item(4)


# a.item(4)

a.item(-1)


a.item(-1)

4


nba = Table.read_table('nba_salaries.csv')
nba


warriors = nba.where("team", "Golden State Warriors")
warriors

warriors = nba.where("team", "Golden State Warriors")
warriors


warriors.select("name", "salary")

warriors.select("name", "salary")

warriors.mean()


warriors.column("salary").mean()

4315935.9228295824

np.average(warriors.select("salary"))


# np.average(warriors.select("salary"))


type(warriors.select("salary"))

datascience.tables.Table


type(warriors.column("salary"))

numpy.ndarray


np.average(warriors.column("salary"))

4315935.9228295824

np.average(warriors.column("salary"))


lakers = nba.where('team', 'Los Angeles Lakers')
warriors.column('salary').mean() - lakers.column('salary').mean()

-839856.02846911922


streets = make_array('Bancroft', 'Durant', 'Channing', 'Haste')
streets

array(['Bancroft', 'Durant', 'Channing', 'Haste'],
      dtype='<U8')


empty_table = Table()
empty_table


print("Rows:", empty_table.num_rows)
print("Cols:", empty_table.num_columns)

Rows: 0
Cols: 0

print("Rows:", empty_table.num_rows)
print("Cols:", empty_table.num_columns)


southside = empty_table.with_column("Streets", streets)
southside

southside = empty_table.with_column("Streets", streets)
southside


southside = Table().with_column("Streets", streets)
southside


empty_table.with_column("Streets", streets)
print("Number of Columns", empty_table.num_columns)

Number of Columns 0


southside = southside.with_column('Blocks from campus', np.arange(4))
southside


Table().with_columns(
    'Streets', streets,
    'Blocks from campus', np.arange(4)
)


du_bois = Table.read_table('du_bois.csv')
du_bois


du_bois = du_bois.with_columns(
    "FOOD $", du_bois.column('ACTUAL AVERAGE') * du_bois.column('FOOD'))
du_bois

du_bois = du_bois.with_columns(
    "FOOD $", du_bois.column('ACTUAL AVERAGE') * du_bois.column('FOOD'))
du_bois


du_bois = du_bois.with_columns("RENT $", 
    du_bois.column("RENT") * du_bois.column("ACTUAL AVERAGE"))
du_bois.sort("RENT $", descending = True)

du_bois = du_bois.with_columns("RENT $", 
    du_bois.column("RENT") * du_bois.column("ACTUAL AVERAGE"))
du_bois.sort("RENT $", descending = True)

rank	name	position	team	salary	season
1	Shaquille O'Neal	C	Los Angeles Lakers	17142000	2000
2	Kevin Garnett	PF	Minnesota Timberwolves	16806000	2000
3	Alonzo Mourning	C	Miami Heat	15004000	2000
4	Juwan Howard	PF	Washington Wizards	15000000	2000
5	Scottie Pippen	SF	Portland Trail Blazers	14795000	2000
6	Karl Malone	PF	Utah Jazz	14000000	2000
7	Larry Johnson	F	New York Knicks	11910000	2000
8	Gary Payton	PG	Seattle SuperSonics	11020000	2000
9	Rasheed Wallace	PF	Portland Trail Blazers	10800000	2000
10	Shawn Kemp	C	Cleveland Cavaliers	10780000	2000

rank	name	position	team	salary	season
41	Donyell Marshall	PF	Golden State Warriors	5250000	2000
47	Erick Dampier	C	Golden State Warriors	4988000	2000
58	Mookie Blaylock	G	Golden State Warriors	4200000	2000
59	Chris Mills	SF	Golden State Warriors	4200000	2000
64	Jason Caffey	F	Golden State Warriors	3937000	2000
89	Vonteego Cummings	PG	Golden State Warriors	2600000	2000
92	Antawn Jamison	PF	Golden State Warriors	2503000	2000
73	Erick Dampier	C	Golden State Warriors	5611000	2001
91	Mookie Blaylock	G	Golden State Warriors	4800000	2001
92	Chris Mills	SF	Golden State Warriors	4800000	2001

CLASS	ACTUAL AVERAGE	RENT	FOOD	CLOTHES	TAXES	OTHER	STATUS
100-200	139.1	0.19	0.43	0.28	0.001	0.099	POOR
200-300	249.45	0.22	0.47	0.23	0.04	0.04	POOR
300-400	335.66	0.23	0.43	0.18	0.045	0.115	FAIR
400-500	433.82	0.18	0.37	0.15	0.055	0.245	FAIR
500-750	547	0.13	0.31	0.17	0.05	0.34	COMFORTABLE
750-1000	880	0	0.37	0.19	0.08	0.36	COMFORTABLE
1000 and over	1125	0	0.29	0.16	0.045	0.505	WELL-TO-DO

CLASS	ACTUAL AVERAGE	RENT	FOOD	CLOTHES	TAXES	OTHER	STATUS	FOOD $
100-200	139.1	0.19	0.43	0.28	0.001	0.099	POOR	59.813
200-300	249.45	0.22	0.47	0.23	0.04	0.04	POOR	117.241
300-400	335.66	0.23	0.43	0.18	0.045	0.115	FAIR	144.334
400-500	433.82	0.18	0.37	0.15	0.055	0.245	FAIR	160.513
500-750	547	0.13	0.31	0.17	0.05	0.34	COMFORTABLE	169.57
750-1000	880	0	0.37	0.19	0.08	0.36	COMFORTABLE	325.6
1000 and over	1125	0	0.29	0.16	0.045	0.505	WELL-TO-DO	326.25

Lecture 5¶

Arrays¶